检索 DynamoDB 上以指定文本开头的列的所有项目

2024-03-28

我在 DynamoDB 中有一个表：

Id: int, hash key
Name: string

（还有很多列，但我省略了）

通常，我只是根据项目的 ID 提取和更新项目，这个模式非常适合这种情况。

然而，要求之一是有一个基于名称的自动完成下拉框。我希望能够查询此 DynamoDB 表中以查询字符串开头的名称列的所有项目。

解决这个问题的 SQL 方法是在 Name 上添加索引并编写一个查询，例如 SELECT Id FROM table WHERE Name LIKE 'query%'，但我无法找出 DynamoDB 友好的查询这样做的方法。

我考虑了几种方法来解决这个问题：

扫描桌子。这是最简单的选择，但效率最低。该表中的数据比我经常扫描的数据要多一些。
扫描+将其缓存在内存中。但随后我不得不担心缓存失效等问题。
将Name设为范围键，支持开始于查询上的函数。但是，我仍然需要扫描表，因为我想检索每个哈希键的结果，所以这实际上不起作用。
建立一个全局二级索引，只用range key来查询。这似乎也是不可能的。我可以拥有一个具有静态值的列，并将其用作 GSI 的哈希键，但这似乎是一个非常丑陋的黑客行为。
使用像 CloudSearch 这样的全文搜索引擎，但这对于我的用例来说似乎是巨大的杀伤力。

这个问题有一个简单的解决方案吗？

目前 DynamoDB 的查询操作不直接支持您描述的用例 - DynamoDB 通常要求您指定一个哈希键，然后相应地对范围键进行查询。

但是，有一种流行的分散收集技术通常用于像您这样的用例。在这种情况下，您将添加一个属性bucket_id并创建一个全局二级索引bucket_id作为哈希键，并且Name作为范围键。

Bucket_id 指的是固定范围的 ID 或数字，具有足够的基数以确保全局二级索引分布均匀。例如，bucket_id范围可以从 0 到 99。然后在更新基表时，每当添加新条目时，都会随机生成一个bucket_id0 到 99 之间的值被分配给它。

在自动完成查询期间，应用程序将为每个bucket_id值（0到99）发送100个单独的查询（分散）并使用BEGINS_WITH在范围键名称上。检索结果后，应用程序必须合并 100 组响应并根据需要重新排序（收集）。

上述过程可能看起来有点麻烦，但它通过确保负载均匀分布在固定的键范围内，使您的系统/表能够很好地扩展。您可以根据情况增大bucket_id范围。为了节省成本，您可以选择投影KEYS_ONLY到您的全局二级索引中，因此查询成本最小化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

amazondynamodb

检索 DynamoDB 上以指定文本开头的列的所有项目的相关文章

使用 Dynamorm 在 Python 中构建 AWS SAM 嵌套应用程序

我在用AWS SAM https aws amazon com serverless sam 构建无服务器应用程序我按照说明构建嵌套应用程序 https aws amazon com blogs compute announcing ne
AWS Lambda 处理来自 DynamoDB 的流

我正在尝试创建一个消耗 dynamoDB 表中的流的 lambda 函数但是我想知道处理在执行过程中可能因某些错误而未处理的数据的最佳实践是什么例如我的 lambda 失败并且丢失了部分流这是重新处理丢失数据的最佳方法这是为你处理
Amazon CloudSearch 从 DynamoDB 创建 Null ID

我正在尝试开始使用 Amazon CloudSearch 我的数据位于我想要搜索的 DynamoDB 表中我能够设置云搜索域它从表中提取字段并让我设置它们等等但是我上传数据时遇到了一些问题我告诉它要从中提取 DynamoDB 表
将 dynamodb 表复制到 hive 的 pyspark 代码问题：不允许操作

我正在尝试使用 pyspark 代码从 aws emr 上的 Dynamodb 创建外部配置单元表当我在 hive 提示符下执行查询时该查询工作正常但当我将其作为 pyspark 作业执行时该查询会失败代码如下 from pysp
如何存储我正在开发的 Alexa 技能的数据？

我目前正在开发一项基于医疗保健的 Alexa 技能所以我需要存储有关疾病诊断和症状的信息我已经掌握了一项基本技能包括在一个文件中包含有关一种疾病的信息制作了一个 zip 文件将其上传到 AWS Lambda 并获得了 Amazo
C++ 中的 HMAC SHA256 (DynamoDB)

我正在尝试通过 REST Web API 连接到 DynamoDB 它要求我使用 HMAC SHA256 生成签名我已经让 SHA 256 工作了但我似乎无法让 HMAC 工作这里是 C 代码使用 OpenSSL string hm
AWS NodeJS SDK V3 DynamoDB UpdateItem - TypeError：无法读取未定义的属性“0”

我正在尝试使用新的适用于 NodeJS 的 AWS SDK V3 在 NodeJS 中进行基本的数据库更新操作我尝试更新的数据对象如下所示 auth BOOL false username S siegbert secondsLeft N
尝试将 AWS DynamoDB 与 Swift 3 结合使用时出现很多错误

我是快速开发的新手正在尝试合并后端我认为 AWS 将是实现我想要完成的任务的好方法我目前只是想获取他们为您创建的示例项目文件它有很多错误令人难以置信我意识到 AWS 在 Swift 2 中创建文件因此在 Swift 3 中运行
自动 AWS DynamoDB 到 S3 导出失败，并显示“role/DataPipelineDefaultRole 无效”

严格按照以下说明进行操作这一页 http docs aws amazon com amazondynamodb latest developerguide DataPipelineExportImport Exporting html我正在
AWS S3 中有乐观锁吗？

我在 s3 中有一个 excel 文件由于不同的程序读取和写入它我需要保证每个程序都写入它们读取的版本 S3仅保证新创建对象的读后一致性以及覆盖和删除对象的最终一致性如果您的 Excel 文件足够小小于 400kb 您可以将其存储
如何批量获取DynamoDB中的索引表？

如何在DynamoDB中批量获取全局二级索引这些参数给了我一个架构错误因为这个哈希键仅在索引表中主键有其他 const params RequestItems MyTableName Keys ThisHashKeyIsOnlyInI
调用 Scan 操作时如何解决（AccessDeniedException）：用户：arn：aws：sts ...无权执行：dynamodb：对资源进行扫描..”？

我正在尝试使用 Elastic Beanstalk 和 Flask 将类似 Instagram 的应用程序部署到 AWS 使用后电子部署命令我能够访问应用程序主页这不需要访问 DynamoDB 表当我尝试登录时应用程序应访问 Dyn
具有“Limit”参数的 DynamoDB SCAN 操作成本

我对 AWS DynamoDB 还很陌生在阅读了文档后我不能 100 确定使用 Limit 中的参数SCAN手术我知道应该设计表格以便QUERY主要使用操作并且SCAN会扫描整个表从而消耗大量的读取能力我还了解到 FilterE
Objective-C 中带有扫描过滤器的 dynamodb scanexpression

AWSDynamoDBObjectMapper dynamoDBObjectMapper AWSDynamoDBObjectMapper defaultDynamoDBObjectMapper AWSDynamoDBScanExpressi
返回 dynamodb 中具有最大排序键的项目

我正在使用 python 脚本访问 AWS 中的 dynamodb 数据库我有一个带有哈希键和排序键的表对于给定的哈希键我想找到具有小于某个值的最大排序键的项目我怎样才能做到这一点或者有没有办法从给定的键查找前一项 I am n
DynamoDB：键及其含义

我对如何使用 DynamoDB 表键感到困惑该文档提到了 HASH 似乎也称为分区键和 RANGE 或排序键我试图将这些与我之前对数据库索引理论的理解大致保持一致我目前主要基于猜测的理解是 HASH 键本质上是主键它必须是唯一的
Django 中是否有适用于 Amazon DynamoDB 的良好数据库后端？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想在我的下一个 Django 项目中使用 DynamoDB 我已经找到了将会话数据存储到 Dynam
Hive ParseException - 无法识别“结束”“字符串”附近的输入

尝试从现有 DynamoDB 表创建 Hive 表时出现以下错误 NoViableAltException 88 at org apache hadoop hive ql parse HiveParser IdentifiersParser
检查 DynamoDB 中是否存在表的最佳方法是什么？

检查 DynamoDb 中是否存在表的最佳方法是什么如果代码是 PHP 语言我将不胜感激要么活跃要么不活跃稍后作为错误代码 400 的各种情况的示例添加检查表是否存在很容易它可以有以下之一表状态 gt 创建活动删除或更新
全文搜索 DynamoDB

以下情况我正在为我的客户将元素存储在 DyanmoDb 中 HashKey 是元素 ID Range Key 是客户 ID 除了这些字段之外我还存储一个字符串数组 gt 标签例如 Pets House 和多行文本我想在我的应用程序中

随机推荐

ELF的基址

我正在尝试查找 ELF 文件的基地址我知道您可以使用 readelf 来查找程序入口点和不同部分的详细信息基址大小标志等例如 x86 架构的程序通过链接器基于 0x8048000 使用 readelf 我可以看到程序入口点但输出
如何在 Visual Studio 11 Beta 中使用 XNA 项目？

Visual Studio 11 几周前发布现在ReSharper 可用 http blogs jetbrains com dotnet 2012 03 resharper 70 eap visual studio 11 beta edi
rvest，如何在 html_nodes 中具有 NA 值以创建数据表

所以我正在尝试制作网站上一些信息的数据表这就是我到目前为止所做的 library rvest url lt https uws community symplicity com index php s student group page
Kotlin 检查了来自 Any? 的演员表映射<字符串，任意>

I have Any 来自java 我想进行检查演员表以免生成以下警告是否可以您可以投射到Map lt gt 但无法检查类型参数如果你确定if it s a Map 那么它是一个Map
Google Maps API：同一张地图上的多个方向/路线

我在同一个 Google 地图上显示多条路线时遇到问题我有一个从我的控制器获得的位置列表以这种形式 7 0 arriveeLat 48 784 arriveeLng 2 40735 departLat 48 9016 departLng
RuntimeError：维度指定为 0 但张量没有维度

我试图使用 MNIST 数据集实现简单的 NN 但我不断收到此错误将 matplotlib pyplot 导入为 plt import torch from torchvision import models from torchvisi
如何从独立存储中读取图像并将其显示在图像元素上？

我需要从加载图像隔离存储 http msdn microsoft com en us library system io isolatedstorage 28v VS 95 29 aspx 并将其显示在图像 UIElement 上我调查了
在fabricJS中以相同的左原点缩放时保持相同的对象大小

我见过这个帖子 https stackoverflow com questions 48578974 maintaining object size while zooming in fabric js并尝试仅使用 X 缩放来完成我自己的功
如何使用 jquery 判断 gif 是否已完全动画化

如果我有一个仅运行单个动画的 IE 动画 gif 它不循环有没有办法使用 jquery 或任何与此相关的东西来告诉动画何时完成我不想告诉文件是否已完全加载但动画已经运行完毕我认为没有办法从 JavaScript 中检测到它我会选择
如何解压 Pandas 中的一系列元组？

有时在使用 Pandas 时我最终会得到一系列元组列表例如当执行分组并传递具有多个返回值的函数时这种情况很常见 import numpy as np from scipy import stats df pd DataFrame
ConstraintLayout 无法转换为 android.widget.TextView

当我尝试启动活动时不断收到运行时错误发生错误的行 private OnItemClickListener mDeviceClickListener new OnItemClickListener public void onItemCl
在 Java 应用程序中查找线程创建的来源

我正在开发一个存在线程问题的 Java 应用程序在使用带有 Netbeans 分析器的应用程序一段时间时我可以看到创建了多个线程他们中的大多数人都以某种方式完成 5 seconds 我只能找到应用程序中使用的 SwingWorkers
如何在 Maven Shade 插件中设置清单类路径？

我正在使用阴影插件除了能够通过设置清单的类路径之外一切正常
QMainWindow::splitDockWidget 的 QDockWidget 拉伸因子？

我正在使用 QMainWindow 在 C 中手动布局 Qt 应用程序我想要在屏幕底部有两个并排停靠的小部件但我希望它们具有不成比例的宽度目前我只能让它们具有相同的宽度有没有办法设置拉伸因子或其他机制来获得不均匀的码头分割以下是
显示所有数据库名称

有没有办法使用主机地址和端口显示所有数据库名称喜欢SELECT current database 显示当前连接的数据库我需要显示所有数据库名称提前致谢有一个表显示所有数据库 SELECT FROM pg database
使用express.js 处理猫鼬连接的正确方法是什么？

我有一个非常简单的 server js 设置我正在尝试运行 var express require express wines require routes testscripts var app express app get firs
关于如何制作影响 Angular 中所有组件的主题机制的指南？

问题我需要有关如何在 Angular 中编写机制以在我的应用程序中全局设置组件的外观和感觉的指导请注意我正在努力学习 ngrx 平台 https github com ngrx platform我认为这将是一个有趣的设计约束然而
为什么 tabindex='-1' 阻止键盘

经过几个小时的尝试找出键盘输入在引导模式中不起作用的原因后我终于成功地找出了问题这是我从未想到过的事情但通过纯粹的消除过程发现了它有了tabindex 1 存在于 div 对于引导程序中的模态它完全停止键盘输入我本以为数据属性d
在 Laravel 5 中安装 Guzzle

如何将 Guzzle 安装到 Laravel 5 中我在我的项目中使用 laravel 但我需要像 guzzle 这样的库来让我在 laravel 中轻松使用curl 任何机构可以帮忙吗打开终端切换到你的 laravel 项目根目录并
检索 DynamoDB 上以指定文本开头的列的所有项目

我在 DynamoDB 中有一个表 Id int hash key Name string 还有很多列但我省略了通常我只是根据项目的 ID 提取和更新项目这个模式非常适合这种情况然而要求之一是有一个基于名称的自动完成下拉框我希

检索 DynamoDB 上以指定文本开头的列的所有项目

检索 DynamoDB 上以指定文本开头的列的所有项目 的相关文章

随机推荐

热门标签

检索 DynamoDB 上以指定文本开头的列的所有项目的相关文章