了解 Cassandra 背后的哲学

2023-12-26

我正在尝试熟悉 Apache Cassandra，以完成特定的 PoC 工作。在浏览了网上的各种文章，尝试了各种可用的库/客户端之后，我的脑海中突然出现了一个特定的问题。

我们想到 Cassandra 的最初原因是因为我们想要一个“真正的”分布式数据存储。根据我对“分布”的理解，如果我能够以超级简洁的方式表达自己的话，它最终归结为某种“键值”和某种“一致哈希”！

因此像 Cassandra 这样的键值存储是完美的选择。然而，当我尝试深入了解 Cassandra 中的数据建模的文章时，几乎所有文章都使用 CQL 进行解释/举例。此外，官方声明似乎是 CQL 应该是学习 Cassandra 的“法律上”方式。为什么要如此推动与 SQL 保持一致？

我不需要关系模型，这就是我选择 Cassandra 的原因。我很欣赏它的基本概念，例如分区键/集群列等，并且我想了解它是如何在 CQL 的底层实现的。

询问 Cassandra 专家，我是否真的不适合 Cassandra 用户？我真的应该忘记键值并尝试在我的用例中使用 CQL（如果可能的话）吗？

CQL不仅仅是一颗“糖”，尽管最初创建是为了鼓励人们从 SQL 世界迁移。 CQL 之前的世界是一团糟，数十个客户端以不同的方式编写，全部使用 Thrift 协议——但与 SQL 世界不同的是，Cassandra 每天都在改进，在每个版本中带来新功能——而且往往每一项改进都需要一个新的“客户端版本”，能够处理生成的新类型结果（例如考虑计数器或集合）或使用新功能的新语法。

我很高兴我有机会与 Thrift 客户端（Pelops）一起投入生产超过 3 年——这帮助我了解了很多 cassandra 世界、数据结构等——但现在我永远不会回到这样的客户（尽管它真的很棒！）。

一开始 Cassandra 完全不同，尤其是/曾经

"无模式“意味着 CF 的每一行可以包含不同数量的列，并且没有地方必须声明这些列。这给许多项目带来了灾难，在“运行时”添加新列的可能性导致了这样的情况：你不知道你能在桌子上找到什么。
"超级柱“已弃用的数据结构被宽行取代

既然数据模型是稳定的，CQL 语法带来了更多的可读性，您现在可以迁移到任何您不太熟悉的项目，并且由于独特的语法，您可以了解应用程序如何与数据库通信 - 更多 - 每个新的Cassandra 发布后立即发布了新版本的客户端。

CQL 并不是 SQL 的“子集”，正如许多人所写的那样：在某种程度上，它是一个“超集”，因为它能够处理扩展基本语言的不同数据结构。

我的回答是：以键值方式思考但仅使用 CQL

哈特哈，卡洛

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

了解 Cassandra 背后的哲学的相关文章

Cassandra 中的二级索引和倒排索引有什么区别？

当我读到这两篇文章时我认为他们都在解释相同的方法我用谷歌搜索但什么也没找到执行上有区别吗 Cassandra本身有二级索引但倒排索引必须自己实现顺便问一下哪个搜索速度更快主要区别在于 Cassandra 中的二级索引的分布方式
检查 Cassandra 中收集列的当前 TTL

假设我有一个具有以下架构的列族 CREATE TABLE users user id timeuuid name varchar last name varchar children list phone numbers map PRIMA
使用 cassandra-cli 创建两个复合列

我的列族需要两个复合列关键数据类型是BytesType 以下是使用 CQL 的表定义 CREATE TABLE stats gid blob period int tid blob sum int uniques blob PRIMARY
安装cassandra时出错

我正在尝试按照此处的说明在 ubuntu 16 04 LTS 上安装 apache cassandra gt http docs datastax com en cassandra 3 x cassandra install install
如何理解Cassandra中的“灵活模式”？

我是 Cassandra 的新手可以在下面的维基百科中找到列族自 CQL 3 起称为表类似于 RDBMS 关系数据库管理系统中的表列族包含行和列每行都由行键唯一标识每行有多列每列都有名称值和时间戳与 RDBMS 中的
有没有好的方法来检查 Datastax Session.executeAsync() 是否引发异常？

我试图通过调用来加速我们的代码session executeAsync 代替session execute 用于数据库写入我们有数据库连接可能会关闭的用例目前是之前的execute 当连接丢失集群中没有可访问的主机时抛出异常我们可
如何从 Spark UI 检索输出大小和写入记录等指标？

如何在任务或作业完成后立即在控制台 Spark Shell 或 Spark 提交作业上收集这些指标我们使用 Spark 将数据从 Mysql 加载到 Cassandra 数据非常庞大例如 200 GB 和 600M 行当任务完成后
Cassandra 集群 - 特定节点 - 特定表高丢弃突变

我在生产中的压缩策略是 LZ4 压缩但我将其修改为 Deflate 对于压缩更改我们必须使用 nodetool Upgradesstables 强制升级所有 sstable 上的压缩策略但是一旦在集群中的所有 5 个节点上完成了 U
TaskSchedulerImpl：初始作业尚未接受任何资源；

这就是我正在尝试做的事情我创建了DataStax企业集群的两个节点在其上创建了一个java程序来获取一张表 Cassandra数据库表的计数该程序是在 eclipse 中构建的实际上是来自 windows 盒子从 Windows
Datastax Cassandra OpsCenter 服务未在 Windows 7 上启动

我是卡桑德拉的新手我按照中提到的说明在 Windows 7 64 位上安装了 DataStax Cassandra 社区版DataStax 社区版 http www datastax com 2012 01 getting started
无法在 Mac 上将 JanusGraph 连接到本地 Cassandra

我已在 Mac OS X 10 11 6 上安装并运行 Cassandra 3 11 1 跑步cqlsh在终端中打印以下消息 Connected to Test Cluster at 127 0 0 1 9042 cqlsh 5 0 1 C
Cassandra CQL 查询检查多个值

如何使用 Cassandra CQL 查询检查非主键字段的值是 A 还是 B 我使用的是Cassandra 2 0 1 这是表定义 CREATE TABLE my table my field text my field2 text PRI
引起原因：com.datastax.driver.core.exceptions.InvalidQueryException：日期长度应为 8 或 0 字节 (13)

我正在尝试使用 spring data cassandra 插入数据但是当我的应用程序使用 Spring Boot 版本是 1 5 3 运行时我遇到了以下错误我在spring data中添加了一个实现CrudResposity的自定义
无法使用 OpsCenter 5.2.1 备份到 S3

我将 OpsCenter 从 5 1 3 升级到 5 2 0 然后升级到 5 2 1 我在升级之前配置了到本地服务器的计划备份和 S3 位置这与 OpsCenter 5 1 3 配合良好在升级期间或升级之后我没有对计划备份进行任何更改
Apache Nifi/Cassandra - 如何将 CSV 加载到 Cassandra 表中

我每天都会收到多次传入的各种 CSV 文件存储来自传感器的时间序列数据这些传感器是传感器站的一部分每个 CSV 均以其来源的传感器站和传感器 ID 命名例如 station1 sensor2 csv 目前数据存储如下 gt cat
非二级索引查询尚不支持非主键列（事件类型）上的 Cassandra 谓词

我开发了一个如下所示的表其中主键为id 它是一个uuid类型 id date eventtype log password priority sessionid sourceip user useragent
使用 Cassandra 进行单元版本控制

我的应用程序使用 AbstractFactory 作为 DAO 层因此一旦实现了 HBase DAO 系列创建 Cassandra DAO 系列并从多个角度查看差异对我来说将是非常好的不管怎样试图做到这一点我看到 Cassandr
无法使用 datastax java 驱动程序通过 UDT 密钥从 cassandra 检索

我正在尝试使用用户定义的类型作为分区键将对象存储在 cassandra 中我正在使用 datastax java 驱动程序进行对象映射虽然我能够插入到数据库中但无法检索该对象如果我更改分区键以使用非 udt 例如文本我就能够保存和
Cassandra CAS INSERT 对于具有毫秒延迟的请求超时

我们正在对 cassandra 集群 3 个节点复制因子 3 进行负载测试并开始偶尔接收到写入超时异常对于一张表上的 CAS 插入操作 CREATE TABLE users by identity account ascii domai
cassandra 中的突变是什么？

cassandra 中的突变是什么它在做什么我没有找到任何有关它的完整信息您可以回答或分享带有手册或说明的链接吗谢谢 Mutation 是一个由 thrift 生成的类定义在cassandra thrift文件您可以在以下位置找

随机推荐

什么时候将标志存储为位掩码比使用关联表更好？

我正在开发一个应用程序其中用户具有不同的权限来使用不同的功能例如读取创建下载打印批准等权限列表预计不会经常更改我有几个选项可以选择如何将这些权限存储在数据库中在什么情况下选项 2 会更好 Option 1 使用关联表 Us
有人可以解释一下这种类型的递归是如何工作的吗？

我在递归中遇到了这个问题我不明白它是如何工作的我了解递归的基础知识但这让我完全困惑请帮忙 main foo 3 void foo int x if x gt 1 foo x printf d x foo x 我以为这个程序不会打印任
使用 ImageMagick 检测 EXIF 方向并旋转图像

佳能数码单反相机似乎可以横向保存照片并使用exif orientation进行旋转问题如何使用 imagemagick 使用 exif 方向数据将图像重新保存到预期方向以便不再需要 exif 数据以正确的方向显示 Use the 自动
检查 SQL 对象是否被任何其他 SQL 对象引用

我刚刚在读书这个所以线程 https stackoverflow com questions 26336840 accessing the name of the currently executing stored procedure n
解析没有键的 JSON 数组

我正在尝试解析jsonArray但无法理解这种格式如何解析这种类型jsonArray 谁能帮我 rows farmfresh 20171211 4 farmfresh product d 20171215 4
Selenium ChromeDriver 切换选项卡

当我单击测试中的链接时它会打开一个新选项卡我希望 ChromeDriver 然后专注于该选项卡我尝试了以下代码来让 ChromeDriver 使用 ctrl tab 快捷方式更改 tabas Actions builder new A
函数“fn:encode-for-uri”导致 XSLT 出错

我需要对 XSLT 中的字符串进行 URL 编码但函数 fn encode for uri 破坏了脚本我在网上查了一下显然它是命名空间的一部分 http www w3 org 2005 xpath functions 因此我将以下行
与另一个启动文件链接

我正在尝试使用以下命令将程序与我自己的启动文件链接STARTUPLD 脚本中的指令 ENTRY start STARTUP my crt1 o GCC驱动程序用于链接程序不关心像libgcc等库路径 gcc T my script ld
如何仅使某些结构字段可变？

我有一个结构 pub struct Test pub x i32 pub y i32 我想要一个改变这个的函数简单 pub fn mutateit mut self self x 1 这使得整个结构在函数调用期间是可变的mutateit
java中工厂方法模式如何使用泛型？

我的代码如下所示 public interface BaseDAO marker interface public interface CustomerDAO extends BaseDAO public void createCustom
如何让 SoapClient 尊重会话？

我正在使用电子商务购物车的 SOAP API 但我似乎无法让会话在不同页面中持续存在作为示例我下面有一些测试代码带有一堆调试消息它将一个项目添加到购物车然后查看购物车当我在浏览器中运行它时它工作得很好但是如果我刷新页面我预
Flutter Google Chart Gauge - 将标签放在中心内

我正在看图表颤振 https pub dartlang org packages charts flutter包裹我需要实现一个仪表图表其中有一个分段及其标签值位于仪表的中心请参阅下面的模型文件其中所需类型的三个图表放置在一行中使
仅使用变量进行单元测试

我正在使用 Objective c 为 iPhone 应用程序编写单元测试例如我只想在编译测试用例时使用一些变量 ifdef UNIT TESTING synthesize requestFinished networkAvailabl
DTO 和实体是否都应该具有输入验证

我有一个 WCF 层我的域模型位于该 WCF 层后面我使用 Nhibernate 作为 ORM 工具我的所有业务逻辑数据访问等都将位于此 WCF 层后面我正在向我的客户公开 DTO 我有以下问题 1 我应该创建DTO吗直接向 W
针对开发的伪代码编辑器的建议[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Python Minidom：更改节点的值

我正在使用 Python 的 minidom 库来尝试操作一些 XML 文件这是一个示例文件
当套接字错误发生时，QWebSocket 底层的 QTcpSocket（或 QSslSocket）是否会被自身破坏？

When a QTcpSocket or QSslSocket 升级为QWebSocket 前者必须存储以供将来使用因为它需要无论何处都移动到同一个线程QWebSocket正在moveToThread deleteLater 每当QWe
Windows Azure 网站覆盖了我的 node.js 应用程序中的 404 和 500 错误页面

我正在使用 Windows Azure 网站来托管 node js 应用程序到目前为止除了我的自定义错误之外一切都很好在我的节点应用程序中我有一个错误处理程序可以在我的本地计算机上很好地呈现自定义 404 和自定义 500 错误
保留 python os.popen() 的彩色输出

我正在使用 Python 使用 msbuild exe 从给定目录构建多个 VS 解决方案我只想要特定的输出但为了节省工作解释结果的最佳方法是使用原始 ANSI 编码 Example import os output os popen
了解 Cassandra 背后的哲学

我正在尝试熟悉 Apache Cassandra 以完成特定的 PoC 工作在浏览了网上的各种文章尝试了各种可用的库客户端之后我的脑海中突然出现了一个特定的问题我们想到 Cassandra 的最初原因是因为我们想要一个真正的分

了解 Cassandra 背后的哲学

了解 Cassandra 背后的哲学 的相关文章

随机推荐

热门标签

了解 Cassandra 背后的哲学的相关文章