我非常精通关系数据库设计的理论和实践。
我知道什么有效,什么无效,什么是高性能的,什么是可维护的(几乎 - 当您开始拥有真实数据时,总是有需要调整的地方)。
看来我找不到关于分布式可扩展数据库的大量知识,例如 Google 的 Bigtable(用于为 Google 应用程序引擎编写应用程序)。什么有效,什么无效,什么可以扩展,为什么不行?
当然,有一些博客文章和文章,但是有关于为 bigtable 和类似数据库范例设计数据库的书籍或学术研究论文吗?
...有书籍或学术研究吗
关于设计数据库的论文
bigtable 和类似数据库
范式?
那么 Bigtable 本身本质上就是一个数据库,所以我认为您的问题更多是关于如何在这些类似 Bigtable 的数据库中建模并在某种程度上设计您的模式。更具体地说,您想知道如何在 Google 的 App Engine 上执行此操作。
通过 GAE,您将使用 Datastore API,它为 Bigtable 添加了一个重要的抽象层,因此在某种程度上,您不必像使用 HBase 之类的东西那样担心低级细节。 SO 上有一些帖子(这是一个很好的答案 https://stackoverflow.com/questions/103727/how-to-think-in-data-stores-instead-of-databases/104777#104777我认为他是 GAE 团队的一员),他将指导您并提供如何使用这种新型数据库系统的提示。
有用的信息:
-
HBase http://hadoop.apache.org/hbase/受到谷歌的启发Bigtable http://research.google.com/archive/bigtable.html (备用链接 http://research.google.com/archive/bigtable.html) paper
-
超表 http://www.hypertable.org/也受到 Bigtable 论文的启发
-
卡桑德拉 http://incubator.apache.org/cassandra/'s 数据模型受到 Bigtable 论文的启发
-
Hadoop http://hadoop.apache.org/受到谷歌的启发GFS http://labs.google.com/papers/gfs.html and 映射减少 http://labs.google.com/papers/mapreduce.html papers
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)