在 dynamodb 中搜索文本,分解表格

2024-04-18

目前,我正在考虑如何使用 AWS DynamoDB 在文本字符串中搜索关键字(例如,在字符串“I'm a very happy man”中搜索“happy”并返回该文本)。有办法查询这个吗?

我所知道的是,查询允许“开始”或“之间”,这在这种情况下并没有真正帮助我。

另外,假设我在表“A”中有一百万条记录,如果我分解表“A”,是否可以轻松地将数据迁移到不同的表“B”/“C”?

提前致谢!


DynamoDB 无法有效地查询“Contains”关键字,因为它不会构建索引来执行此操作。唯一构建的索引是主键(散列或散列和范围)、本地二级索引和全局二级索引。在扫描中使用 CONTAINS 过滤器将导致 Dynamo DB 执行全表扫描,这可能会消耗大量配置的读取吞吐量,从而导致其他查询受到限制。如果您不关心这个问题,您可以考虑使用 CONTAINS 过滤器进行扫描。

AWS云搜索更适合全文搜索查询。 AWS 云搜索服务有一个部分记录了如何查询 DynamoDB 中的数据 -http://docs.aws.amazon.com/cloudsearch/latest/developerguide/searching-dynamodb-data.html http://docs.aws.amazon.com/cloudsearch/latest/developerguide/searching-dynamodb-data.html.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 dynamodb 中搜索文本,分解表格 的相关文章

  • 创建 CloudFront Distribution 时出现 Crypp CloudFormation 失败

    我设置了一个 CloudFormation 模板来跟踪 CloudFront 分发等 设置完毕后 我创建了一个AWS CertificateManager Certificate and an AWS CloudFront Distribu
  • 从 Flask 中的 S3 返回 PDF

    我正在尝试在 Flask 应用程序的浏览器中返回 PDF 我使用 AWS S3 来存储文件 并使用 boto3 作为与 S3 交互的 SDK 到目前为止我的代码是 s3 boto3 resource s3 aws access key id
  • 如何动态更新我的 AWS CloudWatch 控制面板?

    我在 CloudWatch 中有几个仪表板 它们代表我的基础设施的静态视图 例如 自动扩展工作组中当前正在运行的实例数量 或者各种关键 EC2 实例的 CPU 磁盘状态 但是 当我添加新实例时 我总是需要手动更新仪表板以将它们包含在显示中
  • 如何通过id获取最近共享的AWS RDS快照?

    我在 AWS RDS 上有 2 个数据库 其中一个用于stage和一个用于production跨 2 个帐户 我正在尝试将数据复制到production to stage每 x 天 我的计划是复制最近的自动备份快照production并分享
  • AWS 从实例元数据检索安全凭证

    这不是问题的重复使用 API 调用获取我的 AWS 凭证 https stackoverflow com q 34810642 850848 因为我具体询问亚马逊在他们给出的示例中的含义 我正在看这里 http docs aws amazo
  • AWS Cognito - 如何确定用户是否使用电子邮件或电话号码注册

    我们已经按照描述实施了自定义身份验证触发器here https docs aws amazon com cognito latest developerguide user pool lambda challenge html 我们设置了用
  • AWS API Gateway 403 禁止

    我在 AWS API Gateway 中创建了一个 API 在该 API 中 我创建了一个带有自定义 http 端点的代理资源 但是当我访问API网关端点时https 2r3g3ttr6y execute api eu east 1 ama
  • 更新 DynamoDB 中的多条记录

    如何在单个查询中更新 DynamoDB 中的多条记录 我有一个 csv 文件作为基于 csv 文件的输入 我必须更新数据库中的多条记录 只有一个属性 有可用的 API 吗 或者这可以使用批处理 Spring batch 来完成 Dynamo
  • 如何更改 Amazon Redshift 中的默认时区?

    默认情况下将时间戳列设置为 SYSDATE 将其存储为UTC 是否可以更改时区 以便 SYSDATE 将日期和时间存储到不同的时区 到目前为止 我已经检查了SET http docs aws amazon com redshift late
  • 每次在我的 AWS SQS 目标上推送通知时如何触发事件?

    我正在将 AWS SQS 用于 Amazon MWS 订单 API 每当有人从已将我添加为其开发人员的卖家帐户订购时 亚马逊都会将通知发送到我的 AWS SQS 应用程序 我可以从那里提取通知 但为此 我必须创建一个调度程序来提取通知 我是
  • 如何使用 AWS Glue 开始处理从 Web 服务终端节点提取的数据?

    更多源数据来自我需要定期轮询的 Web 服务端点 获得数据后 我可以使用 pyspark 执行传统的 ETL 并最终将数据写入 S3 和 Redshift 我不确定如何进行初始提取 甚至不确定我应该在 AWS Glue 文档中查找什么内容
  • 将密钥对添加到现有 EC2 实例

    我被给予AWS控制台访问正在运行 2 个实例的帐户 但我无法关闭 在生产中 但是 我想获得对这些实例的 SSH 访问权限 是否可以创建一个新的密钥对并将其应用到实例 以便我可以通过 SSH 访问 获取现有的pem当前无法选择创建实例所用的密
  • X-Amz-Expires 是向 AWS 发出的请求所需的标头/参数吗?

    Is X Amz Expires必需的标头 参数 官方文档不一致 用在一些例子 http docs aws amazon com AmazonS3 latest API sigv4 query string auth html 虽然不在ot
  • 如何修改 Amazon RDS 实例的 my.ini 参数

    在启动 MySQL 5 5 RDS 实例时 Amazon 使用默认参数组来配置 my ini 参数 但控制台不允许我修改它们 我怎样才能实现这个目标 例如默认将存储引擎设置为MyISAM或设置字符集 此处记录了这一点 http aws am
  • 在 Serverless Framework 1.0 中使用路径参数

    我想使用路径参数 customer customerId of a GET请求以使用 AWS Lambda 查询客户 functions createCustomer handler handler createCustomer event
  • 使用 Elastic Beanstalk 进行 Logback

    我在使用 Elastic Beanstalk 记录应用程序日志时遇到问题 我正在 AWS Elastic Beanstalk 上的 Tomcat 8 5 with Corretto 11 running on 64bit Amazon Li
  • 使用无服务器访问 SSM 变量

    我想用无服务器变量中的 SSM 参数 https serverless com blog serverless v1 22 0 按照文档 我运行了以下命令 aws ssm put parameter name foo value bar t
  • 如何在PHP中将图像从内存上传到AWS S3?

    所以我目前有一个使用 AWS S3 上传图像的上传系统 这是代码 Upload image to S3 s3 Aws S3 S3Client factory array key gt mykey secret gt myskey try s
  • 从 API 网关自定义授权方返回的 401 缺少“Access-Control-Allow-Origin”标头

    为了防止未登录的用户通过 AWS API Gateway 调用我的 lambda 函数 我使用自定义授权者 lambda 解决方案 如果请求被授权 200 并且我从被调用的 lambda 得到响应 一切正常并且我得到Access Contr
  • 如何在AWS策略中提供多个StringNotEquals条件?

    我正在尝试编写 AWS S3 存储桶策略 拒绝所有流量 除非来自两个 VPC 的流量 我正在尝试编写的策略如下所示 两者之间有逻辑与StringNotEquals 除非这是无效的政策 Version 2012 10 17 Id Policy

随机推荐

  • 手动更改 GUID - 这有多糟糕?

    手动更改生成的 GUID 并使用它有多糟糕 碰撞的可能性是否仍然微不足道 或者使用 GUID 进行操作是否危险 有时我们只是更改之前生成的 GUID 的某些字母并使用它 我们应该停止这样做吗 注意 这个答案错过了一些旧的格式 并且在不久的将
  • 使用 lerna 时保留关键字“interface”

    我有一个使用创建的反应项目create react app我现在正在尝试将其转换为 monorepo 架构 我将所有独立代码移至一个包 package1 中 并将其余代码 以及 App tsx 和 index tsx 移至另一个包 pack
  • 警告 BlockManagerMasterEndpoint:没有更多副本可用于 rdd

    当使用 YARN 在 pyspark 中缓存大型数据帧时 我看到以下类型的消息 WARN BlockManagerMasterEndpoint No more replicas available for rdd 23 62 这条消息到底是
  • 获取行中的第一个和第二个 td 元素

    我有一个 ajax 调用附加到表行内图片的单击事件 单击图片并启动单击事件后 我需要获取第一个和第二个td该行中的元素 我是 jQuery 新手 所以下面是我的最新尝试 不起作用 变量firstName and lastName两者最终都是
  • 如何模拟ResourceBundle.getString()?

    我嘲笑失败ResourceBundle getString 这是我的代码 ResourceBundle schemaBundle Mockito mock ResourceBundle class Mockito when schemaBu
  • 如果使用 AngularJS 更改输入,如何向输入添加类?

    我在表单中编写了以下代码 td td
  • Python 和 JSON:ValueError:未终止的字符串始于:

    我读过多篇关于此问题的 StackOverflow 文章以及大部分 Google 前 10 名结果 我的问题的不同之处在于我使用 python 中的一个脚本来创建 JSON 文件 不到 10 分钟后运行的下一个脚本无法读取该文件 简而言之
  • 在 jQuery 中使用通配符 ID 并获取通配符 ID

    我有4个ID hideshow1 hideshow2 hideshow3 hideshow4 现在 当单击这些 ID 的按钮时 我想最后使用这些整数执行单独的操作 到目前为止我有这个 document ready function id h
  • 如何在 Javascript 或 JQuery 中获取上个月的最后一天

    我有以下代码来获取当前日期 var month new Array 12 month 0 January month 1 February month 2 March month 3 April month 4 May month 5 Ju
  • Elastic Beanstalk 和 Dockerfile ARG 指令

    我需要将一些参数传递给我的docker build命令 我知道这可以使用ARG内的指令Dockerfile 现在假设我有以下内容Dockerfile ARG myvar 并使用命令docker build build arg mvar my
  • 对象中的公共可变字段

    是否可以在 F 中创建一个简单的公共可变字段 我正在创建一个将从 C 程序访问的库 并且我需要能够从 C 设置一个字段 C Equivalent public class MyObj public int myVariable F type
  • 如何将文本从动态生成的用户控件传输到文本框

    我有一个 Windows 窗体 其中有一个button1当点击时UserControl动态添加到代码中的内容是这样的 int c 0 private void button1 Click object sender EventArgs e
  • 如何根据 char 列对 MySQL 表进行分区?

    是否可以根据char列进行分区 查看 MySQL 5 1 文档后发现只能使用整数类型 它是否正确 或者我可以使用一些函数将 char 转换为整数吗 所讨论的 char 字段包含唯一标识符 MySQL 5 1 中的分区只能处理整数列 Sour
  • 加特林 - 顺序执行场景

    当我运行如下代码时 setUp scenario1 inject constantUsersPerSec 1 during 1 second scenario2 inject constantUsersPerSec 1 during 1 s
  • 保持文本在画布上垂直居中

    我遇到的问题是将用户输入的文本保持在画布元素内垂直居中 我已经构建了一个测试环境来尝试解决这个问题 我在这篇文章中提供了该环境以及小提琴 这是我的代码 HTML Enter Your Text br
  • 使用gensim加载LdaMallet模型并对未见过的文档进行分类的正确方法

    在我的项目中 我使用Python库gensim https radimrehurek com gensim models wrappers ldamallet html用于主题建模 文本提取 我尝试加载经过训练的 LdaMallet 模型来
  • Struts 2 中的 HTTP Referer 标头

    Struts2下如何获取Referer header 现在我正在使用 ActionSupport 类 但我似乎无法获取 ServletActionContext 对象或实现 ServletRequestAware 接口 Struts2中的S
  • ASP.NET Page_Init 被触发两次!

    我有 AutoEventWireup true 并在我的代码后面 protected void Page Init object sender EventArgs e 当我调试时 Page Init 方法被触发两次 这是怎么回事 让我们确保
  • (Z3Py) 声明函数

    我想在简单的 result x t c 公式中找到一些给定结果 x 对的 c 和 t 系数 from z3 import x Int x c Int c t Int t s Solver f Function f IntSort IntSo
  • 在 dynamodb 中搜索文本,分解表格

    目前 我正在考虑如何使用 AWS DynamoDB 在文本字符串中搜索关键字 例如 在字符串 I m a very happy man 中搜索 happy 并返回该文本 有办法查询这个吗 我所知道的是 查询允许 开始 或 之间 这在这种情况