谷歌的 Dremel 是此处描述 http://research.google.com/pubs/pub36632.html。 Dremel 和 Mapreduce 有什么区别?
Dremel http://research.google.com/pubs/pub36632.html and 映射减少 https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html它们不具有直接可比性,而是互补的技术。
MapReduce 并不是专门为分析数据而设计的,而是一个软件框架,允许节点集合来解决大型数据集的分布式计算问题。
Dremel 是一种数据分析工具,旨在对海量结构化数据集(例如日志或事件文件)快速运行查询。它支持类似 SQL 的语法,但除了表附加之外,它是只读的。它不支持更新或创建函数,也不具有表索引。数据以“列”格式组织,这有助于非常快的查询速度。 Google 的 BigQuery 产品是 Dremel 的实现,可通过 RESTful API 访问。
Hadoop(MapReduce 的开源实现)与“Hive”数据仓库软件相结合,还允许使用 SQL 样式语法对海量数据集进行数据分析。 Hive 本质上将查询转换为 MapReduce 函数。与使用 ColumIO 格式相比,Hive 尝试通过使用表索引等技术来加快查询速度。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)