注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

中吴南顾惟一笑

成功法则就是那19个字

 
 
 

日志

 
 

一些面向商业智能(BI)的数据库(转)  

2009-10-16 10:57:50|  分类: dbms |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Greenplum (http://www.greenplum.com)

目标是PB 级别的超大型数据仓库, 其shared-nothing 的架构不像Teradata 和netezza 一样需要专属高端硬件配合, 任何Intel , AMD 芯片的普通服务器都能很容易的搭建集群环境, SQL Parallel Process + MapReduce 技术优势是其卖点. 国内的淘宝团队也开始考虑使用greenplum + hadoop 的技术构建商业智能平台,支持SQL、Pythons 等编程语言


LucidDB (http://www.luciddb.org/)

它强调自己是一个只为数据仓库目的建造的数据库,同样也有列储存,bitmap indexing , hash join/aggregation 等常见数据仓库技术, 新版中强调在线热备份(Hot/incremental/differential backup - Reduce downtime and archive size/bandwidth)和基于时间点的快照功能, 支持Page-level Multiversioning (never overwrite data pages:  copy-on-write)


注:列导向的数据库(Column-Oriented Database)的典型应用场合是OLAP (On-Line Analysis Processing),因此以列导向的架构设计非常适合于数据仓库的应用。对于大多数数据仓库的分析场景中,实际关注的数据很多时候都只有那么一列或者少数几列的数据。所以在以列为导向的设计中,大部分的分析查询都只需要读取某一个(或者几个)表的几列,而不需要像传统以行为导向的数据库那样需要扫描整个表的数据,这两者IO量的差距是非常大的。

  评论这张
 
阅读(278)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017