使用 Cassandra 和 CQL3，如何在单个请求中插入整个宽行？

2024-01-09

我想将包含 50,000 列的单行插入到 Cassandra 1.2.8 中。在插入之前，我已准备好整行的所有数据（在内存中）：

+---------+------+------+------+------+-------+
|         | 0    | 1    | 2    | ...  | 49999 |
| row_id  +------+------+------+------+-------+
|         | text | text | text | ...  | text  |
+---------+------+------+------|------+-------+

列名是整数，允许切片进行分页。列值是该特定索引处的值。

CQL3表定义：

create table results (
    row_id text,
    index int,
    value text,
    primary key (row_id, index)
) 
with compact storage;

由于内存中已经有 row_id 和所有 50,000 个名称/值对，因此我只想在单个请求/操作中将一行插入 Cassandra，以便尽可能快。

我似乎唯一能找到的就是执行以下 50,000 次：

INSERT INTO results (row_id, index, value) values (my_row_id, ?, ?);

首先?is 是一个索引计数器（i）和第二个?是要存储在位置的文本值i.

这需要很多时间。即使我们将上述 INSERT 放入批处理中，也需要花费大量时间。

我们拥有我们需要的所有数据（完整的行），我认为很容易说“在这里，Cassandra，在一个请求中将此数据存储为一行”，例如：

//EXAMPLE-BUT-INVALID CQL3 SYNTAX:
insert into results (row_id, (index,value)) values 
    ((0,text0), (1,text1), (2,text2), ..., (N,textN));

通过当前的 CQL3 语法无法实现此示例，但我希望它能够说明所需的效果：所有内容都将作为单个查询插入。

是否可以在 CQL3 和 DataStax Java 驱动程序中执行此操作？如果没有，我想我将被迫使用 Hector 或 Astyanax 驱动程序和 Thriftbatch_insert操作代替？

可以使用 Thrift API 中的 batch_mutate 方法，通过使用变异多重映射来完成多个 INSERT / UPDATE。

Map<byte[], Map<String, List<Mutation>>> mutationMap = new HashMap<byte[], Map<String, List<Mutation>>>();

List<Mutation> mutationList = new ArrayList<Mutation>();

mutationList.add(mutation);
Map<String, List<Mutation>> m = new HashMap<String, List<Mutation>>();

m.put(columnFamily, mutationList);

mutationMap.put(key, m);
client.batch_mutate(mutationMap, ConsistencyLevel.ALL);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

cassandra

cql3

datastaxjavadriver

使用 Cassandra 和 CQL3，如何在单个请求中插入整个宽行？的相关文章

Cassandra data stax 驱动程序更新 4.4 查询超时问题

我们的应用程序最近升级到 cassandra datastax 驱动程序 4 4 X 早些时候它是 3 3 版本升级后我们注意到有很多超时问题初始化查询超时会话查询超时控制连接超时以及reference conf中默认的其他超时
设置 cassandra.logdir 的最佳方法是什么

我已将 cassandra 软件放入 home user所有日志文件应放置在 data log Cassandra 具有文件conf logback xml 其中包含用于确定文件日志路径的参数例如 cassandra logdir sys
在 cassandra 中将 json 存储为文本与 blob 相比有何优缺点？

对于我来说 blob 的一个问题是在 java 中 ByteBuffer 在 cassandra 中映射到 blob 不是可序列化的因此不能很好地与 EJB 配合使用考虑到 json 相当大在 cassandra 中存储 json
有没有好的方法来检查 Datastax Session.executeAsync() 是否引发异常？

我试图通过调用来加速我们的代码session executeAsync 代替session execute 用于数据库写入我们有数据库连接可能会关闭的用例目前是之前的execute 当连接丢失集群中没有可访问的主机时抛出异常我们可
布隆过滤器在cassandra中的作用是什么？

从 Cassandra 文档的两个不同链接中我发现 link 1 http docs datastax com en cassandra 3 0 cassandra dml dmlHowDataWritten html 存储在内存中的结构
从 C* 表中获取不同的分区键

cqlsh 不允许嵌套查询因此我无法将所选数据导出到 csv 我正在尝试使用以下命令从 cassandra 导出选定的数据大约 200 000 行单列 echo SELECT distinct imei FROM listener s
通过sparklyr将cassandra表导入spark - 可以仅选择某些列吗？

我一直在与sparklyr要将大型 cassandra 表带入 Spark 请使用 R 注册它们并执行dplyr对他们进行操作我已经成功导入 cassandra 表代码如下 import cassandra table into spa
如何在 AWS Glue 中使用 Spark 包？

我想使用 DatastaxSpark Cassandra 连接器 https mvnrepository com artifact com datastax spark spark cassandra connector 2 12 2 5
哪个 CQL 版本对应哪个 Cassandra 版本？

CQL 文档是根据 CQL 版本而不是 Cassandra 产品版本来组织的显然我想阅读与我正在使用的 Cassandra 版本相对应的 CQL 文档但我找不到有关哪个 CQL 版本对应于哪个 Cassandra 版本的全面信息 CQ
将数据作为 RDD 保存回 Cassandra

我试图从 Kafka 读取消息处理数据然后将数据添加到 cassandra 中就像它是 RDD 一样我的麻烦是将数据保存回 cassandra 中 from future import print function from pys
Cassandra：如何将整个表移动到另一个键空间

我的 Cassandra 的版本信息 cqlsh 5 0 1 卡桑德拉 2 2 5 CQL 规范 3 3 1 本机协议 v4 我正在尝试将一些巨大的表几百万行移动到另一个键空间除了 COPY to csv and COPY from
将 CassandraUnit 与 Astyanax 结合使用时出现依赖性问题

我有一个 SessionDaoCassandraImpl 类它使用 Astyanax 从 Cassandra 读取数据我想使用嵌入式 Cassandra 服务器进行测试卡桑德拉单元 https github com jsevellec
设计 Cassandra 数据模型的最佳实践是什么？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案以及需要避免哪些陷阱您有任何交易中断吗例如我听说导出导入 Cassandra 数据非常困难这让我想知道这是否会妨碍将生产数据
Hector 在执行incrementCounter 后获取结果计数器值

我们正在执行以下操作来更新计数器的值现在我们想知道是否有一种简单的方法可以立即取回更新的计数器值 mutator incrementCounter rowid1 cf1 counter1 value Cassandra thrift AP
Cassandra CAS INSERT 对于具有毫秒延迟的请求超时

我们正在对 cassandra 集群 3 个节点复制因子 3 进行负载测试并开始偶尔接收到写入超时异常对于一张表上的 CAS 插入操作 CREATE TABLE users by identity account ascii domai
cassandra 中的突变是什么？

cassandra 中的突变是什么它在做什么我没有找到任何有关它的完整信息您可以回答或分享带有手册或说明的链接吗谢谢 Mutation 是一个由 thrift 生成的类定义在cassandra thrift文件您可以在以下位置找
卡桑德拉主键。整数与 varchar 的性能影响

在Cassandra中如果主键是varchar而不是int或bigint 是否会有性能损失我有 id 作为主键我不会对此做任何数学运算我使用 id 只是为了插入检索比较我想将其更改为字符串以满足我的要求之一性能会下降吗不会有
Cassandra修复导致节点超时

我们使用具有 5 个节点的 Cassandra 3 10 1 集群每个节点有 8 个核心和 23Gi 内存全部位于同一个 DC 中复制因子 2 一致性级别 2 最近在大约每周进行一次的计划修复期间来自一个节点的查询出现多次超时在
将 Datastax Enterprise Cassandra 迁移到 Apache Cassandra

我们目前使用的是 DSE 4 8 和 5 12 我们想迁移到 apache cassandra 因为我们不使用 Spark 或搜索所以想节省一些钱迁移到 apache 这可以在不停机的情况下实现吗我看到 sstableloader 以其
如何在cassandra中保存spark流数据

构建 sbt以下是build sbt文件中包含的内容 val sparkVersion 1 6 3 scalaVersion 2 10 5 resolvers Spark Packages Repo at https dl bintray

随机推荐

数组上的“each”/“map”会导致 create_time_zone_conversion_attribute 中的“当您没有预料到时，您有一个 nil 对象”？

我有一个按钮它通过 XHR 向 Rails 服务器中的特定操作发送 get 请求此操作调用我在模型类别中定义的函数该函数执行类似 x Category subcategories 的操作并在下一行中执行类似 x map id 或
如何将绘图保存到PDF文件中，周围没有大边距[重复]

这个问题在这里已经有答案了如果我打印一个情节EPS http en wikipedia org wiki Encapsulated PostScript格式时 EPS 文件的内容完全被绘图占据但如果我打印一个情节PDF http en
如何选择*加上另一列[重复]

这个问题在这里已经有答案了我试图从一个表中选择所有值然后选择仅运行这些列之一的函数的输出并将所有这些显示为我的 SQL 查询输出我这样做的目标是从 Geometry 列创建可用的 WKT 输出并将其包含在查询结果中这样我就可以在
FabricInvalidAddressException：尝试从 .NET Core 应用程序连接时出现 NamedEndpoint“V2Listener”

我正在尝试使用以下方式连接到 Service Fabric 应用程序ServiceProxy像这样的类 return ServiceProxy Create
php和mysql将记录从一个表复制到另一个表

我想通过将记录从一个表移动到另一个表来对学生进行存档这是我尝试使用的代码
您相信 ASP.Net MVC 已准备好投入生产吗？

我真的很喜欢 Microsoft 承诺将 MVC 引入 Web 为此我对将我现有的 ASP NET 应用程序之一转换为 MVC 感到兴奋并想知道我是否操之过急虽然这个网站正在使用 MVC 但它在技术上仍处于测试阶段您有什么想法从
Google 容器引擎：访问云存储

我无法让应用程序默认凭据在 Google 容器引擎中工作文档说它们适用于 App Engine 和 Compute Engine 但我被告知它们应该透明地传递到在 Container Engine 上运行的容器这是失败的代码 crede
iOS 7 状态栏与导航栏发生冲突

我的应用程序中有一个视图控制器在故事板中拖动了一个导航栏它在 iOS 6 中运行良好但在 iOS 7 中它看起来像这样状态栏和导航栏不应相互冲突我在堆栈溢出上看到过很多这样的问题但它们对我没有太大帮助有些问题说我应该使用这个
asp.net core 检查中间件中的路由属性

我正在尝试构建一些 ASP Net core 中间件需要查看当前路由是否标记为授权 eg public async Task Invoke HttpContext context if context Request Path Valu
在 PyTables 中，如何创建可变长度的嵌套数组？

我正在使用 PyTables 2 2 1 w Python 2 6 我想创建一个包含可变长度嵌套数组的表我搜索了 PyTables 文档和教程示例 PyTables 教程 3 8 http www pytables org docs ma
Dojo MVC 的简单登录实现

有没有关于如何实现简单的登录页面对话框的示例我一直在尝试使用 dojo 样板来做到这一点检查我之前的问题 Dojo MVC 的布局实现 https stackoverflow com questions 10953316 layout
更新会话变量而不刷新页面[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案当单击 iframe 外部页面中的链接时我需要更新第 1 页上的会话变量当我点击 iframe 的链接时会话变量已成功设置问题是
如何读取.net core api项目中appsetting.json文件中的多个连接字符串

我有多个连接字符串属性例如在 AppSetting json 文件中 connectionstring connection1 datasource1 connection2 datasource2 我想读取控制器或服务文件中的连接字符
Phalcon Multi module - 动态模块注册

大家好我在 Phalcon 的多模块项目中使用以下结构 modules module1 controllers models views module2 controllers models views module n controll
无法使用 Nuitka 编译 Python

我正在尝试编译使用 urllib request BeautifulSoup 和网页浏览器 nuitka python py Nuitka WARNING python py 16 Cannot find urllib request a
使用 Add-on SDK 的 Firefox 插件提供更多存储空间

我想使用插件生成器开发一个插件我读到通过简单的存储一个人的插件可以有大约 5 MB 的空间但 5 mgb 的空间不足以容纳我的应用程序我需要更多我能做什么考虑到附加 SDK API 您无法做太多事情相反你可以冲出沙箱 ht
什么时候应该在 OCaml 中使用对象？

通常 OCaml 程序可以使用或不使用对象来编写什么时候使用物品最有利什么时候应该避免使用物品作为一般经验法则不要使用对象它们带来的额外复杂性通常并不值得我认为这也是适用于其他语言的规则但那是另一回事了至少对于 OCaml
显示本地时间的 MySQL 时间戳

我有一个 MySQL 数据库其中存储的大量数据均采用 UTC 时间的时间戳当用户查询该数据库时我希望他们能够在本地时区查看数据我不想每次都计算偏移量并使用 PHP 代码更改时间戳还有其他办法吗您可以使用localtime htt
android ellipsize 多行textview

我需要省略多行文本视图我的组件足够大可以用椭圆显示至少 4 条线但只显示 2 条线我尝试更改组件的最小和最大行数但它没有任何改变这是问题的解决方案它是 TextView 的子类实际上适用于椭圆化我发现之前的答案中列出的 a
使用 Cassandra 和 CQL3，如何在单个请求中插入整个宽行？

我想将包含 50 000 列的单行插入到 Cassandra 1 2 8 中在插入之前我已准备好整行的所有数据在内存中 0 1 2 49999 row id text text text text 列名是整数允许切片进行分页列值是

使用 Cassandra 和 CQL3，如何在单个请求中插入整个宽行？

使用 Cassandra 和 CQL3，如何在单个请求中插入整个宽行？ 的相关文章

随机推荐

热门标签

使用 Cassandra 和 CQL3，如何在单个请求中插入整个宽行？的相关文章