CQL SELECT 大于索引非键列上的查询

2023-11-23

EDIT1：在原始问题之后添加了一个案例来描述问题。

我希望查询不属于我的键的列。如果我理解正确的话，我需要在该列上定义一个二级索引。但是，我希望使用大于条件（不仅仅是相等条件），但这似乎仍然不受支持。

我错过了什么吗？您将如何解决这个问题？

我想要的设置：

Cassandra 1.1.6
CQL3

CREATE TABLE Table1(
             KeyA int,
             KeyB int,
             ValueA int,
             PRIMARY KEY (KeyA, KeyB)
           );

CREATE INDEX ON Table1 (ValueA);

SELECT * FROM Table1 WHERE ValueA > 3000;

由于 Cassandra 1.1.6 仍然不支持使用复合键在 ColumnFamilies 上定义二级索引，因此我必须采用删除其中一个键的临时解决方案，但我仍然遇到与非相等条件相同的问题。

还有其他方法可以解决这个问题吗？

感谢您的时间。

相关来源：http://cassandra.apache.org/doc/cql3/CQL.html#selectStmt http://www.datastax.com/docs/1.1/ddl/indexes

EDIT1

这里有一个案例可以解释这个问题。正如 rs-atl 指出的，这可能是数据模型问题。假设我在 stackoverflow 上保留了所有用户的列族。对于每个用户，我保留一批统计数据（声誉、答案数、投票数...所有这些都是整数）。我想查询这些统计数据以获取相关用户。

CREATE TABLE UserStats(
             UserID int,
             Reputation int,
             NumOfAnswers int,
             .
             .
             .
             A lot of stats...
             .
             .
             .
             NumOfVotes int,
             PRIMARY KEY (UserID)
           );

现在我有兴趣根据这些统计数据来分割 UserID。我想要所有拥有超过 10K 声誉的用户，我想要所有少于 5 个答案的用户，等等。

我希望这有帮助。再次感谢。

在 CQL 中，您可以应用WHERE一旦为所有列创建了索引（即二级索引），就可以在所有列上使用子句。否则，您将收到以下错误：

Bad Request: No indexed columns present in by-columns clause with Equal operator

不幸的是，即使有二级索引，CQL 也要求 WHERE 子句在二级索引上至少有一个 EQ，因为性能问题.

问：为什么总是需要至少进行一次 EQ 比较二级指标？

答：二级指标的不平等总是存在的在内存中完成，因此在另一个二级索引上至少没有一个 EQ 您将加载数据库中的每一行，其中有大量数据库不是一个好主意。因此，通过要求至少一个 EQ （辅助）索引，您希望限制需要读入的行集内存到可管理的大小。（虽然显然你仍然可以得到也陷入麻烦）。

因此，基本上，如果您除了 EQ 比较之外还有其他任何内容，它都会加载“否则与您的查询匹配”的所有行，并检查它们是否匹配，一次一个。默认情况下不允许这样做，因为它“可能会很慢”。（本质上，索引只是“为了平等”而索引，而不是像关系数据库上的索引那样的之类的其他索引）。

需要注意的一件事是，如果二级指数中有多个非 EQ 条件，则还需要包括ALLOW FILTERING查询中的关键字，否则您将得到

Cannot execute this query as it might involve data filtering and thus may have unpredictable performance. If you want to execute this query despite the performance unpredictability, use ALLOW FILTERING

一种简单的解决方法是将虚拟列附加到表中，其中所有行在该列上都具有相同的值。因此，在这种情况下，您可以仅对所需的列执行范围查询。请认识到，NoSQL 数据库上的此类查询可能会减慢/使系统陷入困境。

Example

cqlsh:demo> desc table table1;

CREATE TABLE table1 (
  keya int,
  keyb int,
  dummyvalue int,
  valuea int,
  PRIMARY KEY (keya, keyb)
) ....

cqlsh:demo> select * from Table1;

 keya | keyb | dummyvalue | valuea
------+------+------------+--------
    1 |    2 |          0 |      3
    4 |    5 |          0 |      6
    7 |    8 |          0 |      9

在 ValueS 和 Dummy Value 上创建二级索引：

cqlsh:demo> create index table1_valuea on table1 (valuea);
cqlsh:demo> create index table1_valueb on table1 (dummyvalue);

执行范围查询ValueA with DummyValue=0:

cqlsh:demo> select * from table1 where dummyvalue = 0 and valuea > 5 allow filtering;

 keya | keyb | dummyvalue | valuea
------+------+------------+--------
    4 |    5 |          0 |      6
    7 |    8 |          0 |      9

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Indexing

cassandra

CQL SELECT 大于索引非键列上的查询的相关文章

Android ArrayList 的 IndexOutOfBoundsException [重复]

这个问题在这里已经有答案了我遇到了一个非常烦人的问题一些代码抛出 IndexOutOfBoundsException 我真的不明白为什么 logcat 指向以下代码的 addTimetableItem 我们将对此进行更多解释 if so
R：返回数据框中匹配的行数和列数

emperor lt rbind cbind Augustus Tiberius cbind Caligula Claudius 如何返回包含序列 us 的所有单元格的行号和列号即 1 1 1 2 2 2 我们可以使用grepl得到一个v
ClientDataset 索引更改时不计算 TAggregateField

我正在使用连接到 DBGrid 的 TClientDataset 和几个聚合字段用于计算其他几个浮点字段的总和所有字段均已在设计时创建一切都按预期工作直到 ClientDataset 的 IndexName 使用自定义索引更改以便
创建数据库索引的最佳实践和“经验法则”有哪些？

我有一个应用程序它循环访问数据库表中的大量记录并对该数据库中的记录执行大量 SQL 和 Net 操作目前我在 PostgreSQL 上使用 Castle ActiveRecord 我在几个字段上添加了一些基本的 btree 索引正如
Datastax Cassandra OpsCenter 服务未在 Windows 7 上启动

我是卡桑德拉的新手我按照中提到的说明在 Windows 7 64 位上安装了 DataStax Cassandra 社区版DataStax 社区版 http www datastax com 2012 01 getting started
将数据作为 RDD 保存回 Cassandra

我试图从 Kafka 读取消息处理数据然后将数据添加到 cassandra 中就像它是 RDD 一样我的麻烦是将数据保存回 cassandra 中 from future import print function from pys
创建前判断MySQL表索引是否存在

我们系统的自动数据库迁移过程涉及运行包含新表定义及其附带索引的 sql 脚本仅当这些表和索引尚不存在时我才需要能够创建它们表是通过使用 IF NOT EXISTS 来处理的但创建索引时不存在这样的语法我尝试编写一个存储过程如下所
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
如何使用 javascript 从 UUID v1 (TimeUUID) 中提取时间戳？

我使用 Cassandra DB 和 Nodejs 的 Helenus 模块来操作它我有一些包含 TimeUUID 列的行如何在javascript中从TimeUUID获取时间戳这个库 UUID 至今 https github com
非集群主键实体框架代码优先

在实体框架代码优先方法中我们是否可以将主键定义为非聚集索引并将其他几个字段的组合定义为聚集索引 Thanks EF 6 2 解决了这个问题目前它处于测试状态但它可以工作首先将 EF 升级到 6 2 Install Packag
jQuery Cycle 插件 - 如何返回当前显示幻灯片的索引号？

我目前正在使用Malsup 的 Cycle 插件 http jquery malsup com 我只是想知道是否可以让循环插件返回当前显示幻灯片的索引号我想在特定幻灯片处于活动状态时更改页面内容不知道如何实现这一点你可以这样做 on
Redis是如何实现高吞吐量和高性能的？

我知道这是一个非常普遍的问题但是我想了解允许 Redis 或 MemCached Cassandra 等缓存以惊人的性能极限工作的主要架构决策是什么如何维持连接连接是 TCP 还是 HTTP 我知道它完全是用C写的内存是如何管理
术语 SSTable 和 LSM Tree 之间有什么区别

这两个术语可以互换使用吗我读过有关 SSTable 工作原理的文章通常文章都会开始提到 LSM Tree 然而它们似乎是同一件事我什么时候应该使用一个术语而不是另一个术语对于凡人来说 SSTables 和 LSM Trees 的最
无法使用 datastax java 驱动程序通过 UDT 密钥从 cassandra 检索

我正在尝试使用用户定义的类型作为分区键将对象存储在 cassandra 中我正在使用 datastax java 驱动程序进行对象映射虽然我能够插入到数据库中但无法检索该对象如果我更改分区键以使用非 udt 例如文本我就能够保存和
mysql LIKE 查询时间太长

SQL SELECT COUNT usr id as total results FROM users as usr LEFT JOIN profile as prof ON prof uid usr uid WHERE usr usern
为什么我的 postgis 不在几何字段上使用索引？

Windows 上的 postgresql 9 5 postgis 2 2 我首先创建一个表 CREATE TABLE points id SERIAL ad CHAR 40 name VARCHAR 200 然后添加一个几何字段 geo
Hector 在执行incrementCounter 后获取结果计数器值

我们正在执行以下操作来更新计数器的值现在我们想知道是否有一种简单的方法可以立即取回更新的计数器值 mutator incrementCounter rowid1 cf1 counter1 value Cassandra thrift AP
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
为 PostgreSQL 查询选择正确的索引

简化表 CREATE TABLE products product no integer PRIMARY KEY sales integer status varchar 16 category varchar 16 CREATE INDE
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID

随机推荐

MediaStore：获取图像数据、缩略图和文件夹

我有两个清单我们将它们称为AlbumsList 和PicturesList 第一个显示相册封面其中一张图像名称和其中的照片数量第二个显示所选相册中包含的所有图像我已经使用 File 类完成了此操作但它运行速度太慢并且当我只需要
导航栏上方的 android Q 内容

我们的应用程序的目标是 API 28 并在状态栏下绘制内容为此我们使用以下标志和样式 window addFlags FLAG LAYOUT NO LIMITS
jquery mobile 中的日期选择器在第二页中添加时是重复的

我需要一些有关移动应用程序中日期选择器使用的帮助我在我的应用程序中使用 jQuery UI 日期选择器但是当我将日期选择器放在第二页时它会显示两次重复但是当我将日期选择器放在第一页时显示正常这是一个示例如果您运行它您可以
有没有办法将命名范围组合成新的命名范围？

I have class Foo lt ActiveRecord Base named scope a lambda a conditions gt a gt a named scope b lambda b conditions gt b
url 中的 django 用户名，而不是 id

在一个迷你虚拟社区中我有一个 profile view 功能这样我就可以查看任何注册用户的个人资料个人资料视图函数将个人资料所属的用户的 id 作为参数因此当我想访问用户 2 的个人资料时我会这样调用它 http 127 0 0
如何使用 PowerShell Invoke-RestMethod 发送多部分/表单数据

我正在尝试通过 Invoke RestMethod 在与带有 F 开关的curl 类似的上下文中发送文件卷曲示例 curl F FileName path to file name https uri to post 在powershel
Elasticsearch节点重启后快速恢复

考虑 elasticsearch yml 中的以下设置 gateway recover after data nodes 3 gateway recover after time 5m gateway expected data nodes
Linux 中对 pthread_create 的未定义引用

我从网上获取了以下演示https computing llnl gov tutorials pthreads include
C++14 中不指定对象的左值

我在这里使用 N3936 作为参考如果 C 14 文本有任何不同请更正此问题 3 10以下左值和右值我们有每个表达式都属于该分类中的基本分类之一左值 x值或纯右值然而定义lvalue reads An lvalue 指定一个函数
C 中的按位连接

我正在尝试在 C 中连接两个二进制数所以如果我有1010 and 0011我希望我的结果是10100011 我写了一个我认为可以完成这项工作的简短例程 include
Eclipse 优化导入以包括静态导入

有没有办法让 Eclipse 自动查找静态导入例如现在我终于升级到了 Junit 4 我希望能够编写 assertEquals expectedValue actualValue hit Ctrl Shift O and have Ec
重置 svg 填充 css

我想让所有 svgs 都具有相同的纯色所以我用 svg fill ccc 但我想在 hover 上获得默认填充如何禁用填充并恢复默认值您可以使用以下方法执行此操作 not 并有效地设置不悬停的样式 svg not hover fi
Jupyter：安装后没有名为“imblearn”的模块

我在 ANACONDA Navigator 上安装了 imbalanced learn 版本 0 3 1 当我使用 Jupyter Python 3 运行不平衡学习网站上的示例时 from imblearn datasets import
Git版本兼容性

使用 Git 进行版本控制与不同版本的 Git 协同工作的效果如何有关的体验好还是坏是什么长话短说我正在考虑将 Git 用于一些计划的家庭项目但由于我使用存储库中的默认包进行的大杂烩设置将意味着完全不同的版本我计划在运行 U
关于 C# 变量作用域与其他语言的问题

首先声明一下我以前没用过C 对它了解不多我正在学习 Sebesta 的编程语言概念第 9 版一书准备编程语言考试当我读到以下摘录自范围声明顺序第246页时我有点困惑例如在 C99 C Java 中所有局部变量的
没有RTTI的shared_ptr？

我正在尝试使用shared ptr在使用 xc32 1 34 gcc 4 5 2 的衍生版本构建的嵌入式项目中该项目已禁用 RTTI fno rtti include
如何在 MVC3 中从 javascript 调用控制器方法？

我使用 MVC3 架构 c net 当焦点更改到下一个字段即密码字段时我需要立即将文本框内容用户 ID 与数据库进行比较所以我想对 User Id 字段使用 onblur 事件然后调用 Controller 方法谁能告诉我如何
通过套接字发送和接收数组

是否可以使用Python通过UDP套接字发送数组我正在使用 Python 2 5 并尝试发送一个简单的数组但它不起作用它可以成功发送数组但是当我尝试使用数组的一项来打印它时程序崩溃了我不确定错误是什么因为我采取了预防措施将数据
使用 psycopg2 将 PostgreSQL UUID 数组作为列表返回

我有一个 SQL 语句其中包含嵌入在ARRAY 像这样 SELECT foo ARRAY SELECT x from y AS bar 查询工作正常但是在 psycopg2 结果游标中数组作为字符串返回如 1 2 3 而不是列表我
CQL SELECT 大于索引非键列上的查询

EDIT1 在原始问题之后添加了一个案例来描述问题我希望查询不属于我的键的列如果我理解正确的话我需要在该列上定义一个二级索引但是我希望使用大于条件不仅仅是相等条件但这似乎仍然不受支持我错过了什么吗您将如何解决这个问题我想

CQL SELECT 大于索引非键列上的查询

CQL SELECT 大于索引非键列上的查询 的相关文章

随机推荐

热门标签

CQL SELECT 大于索引非键列上的查询的相关文章