Greenplum (http://www.greenplum.com)
目标是PB 级别的超大型数据仓库, 其shared-nothing 的架构不像Teradata 和netezza 一样需要专属高端硬件配合, 任何Intel , AMD 芯片的普通服务器都能很容易的搭建集群环境, SQL Parallel Process + MapReduce 技术优势是其卖点. 国内的淘宝团队也开始考虑使用greenplum + hadoop 的技术构建商业智能平台,支持SQL、Pythons 等编程语言
LucidDB (http://www.luciddb.org/)
它强调自己是一个只为数据仓库目的建造的数据库,同样也有列储存,bitmap indexing , hash join/aggregation 等常见数据仓库技术, 新版中强调在线热备份(Hot/incremental/differential backup - Reduce downtime and archive size/bandwidth)和基于时间点的快照功能, 支持Page-level Multiversioning (never overwrite da
注:列导向的数据库(Column-Oriented Database)的典型应用场合是OLAP (On-Line Analysis Processing),因此以列导向的架构设计非常适合于数据仓库的应用。对于大多数数据仓库的分析场景中,实际关注的数据很多时候都只有那么一列或者少数几列的数据。所以在以列为导向的设计中,大部分的分析查询都只需要读取某一个(或者几个)表的几列,而不需要像传统以行为导向的数据库那样需要扫描整个表的数据,这两者IO量的差距是非常大的。
评论