如何优化全文搜索的 Core Data 查询

2023-12-31

在文本中搜索匹配单词时可以优化核心数据查询吗？（这个问题也涉及到 iPhone 上自定义 SQL 与 Core Data 的区别。）

我正在开发一款新的（iPhone）应用程序，它是科学数据库的手持参考工具。主界面是一个标准的可搜索表格视图，我希望在用户输入新单词时得到即时响应。单词匹配必须是文本中单词的前缀。文本由 100,000 个单词组成。

在我的原型中，我直接编写了 SQL 代码。我创建了一个单独的“单词”表，其中包含主实体文本字段中的每个单词。我对单词进行了索引并按照以下方式进行了搜索

SELECT id, * FROM textTable 
  JOIN (SELECT DISTINCT textTableId FROM words 
         WHERE word BETWEEN 'foo' AND 'fooz' ) 
    ON id=textTableId
 LIMIT 50

这运行得非常快。使用 IN 可能也同样有效，即

SELECT * FROM textTable
 WHERE id IN (SELECT textTableId FROM words 
               WHERE word BETWEEN 'foo' AND 'fooz' ) 
 LIMIT 50

LIMIT 至关重要，它可以让我快速显示结果。我通知用户，如果达到限制，则显示太多。这很糟糕。

在过去的几天里，我一直在思考迁移到核心数据的优势，但我担心对重要查询的架构、索引和查询缺乏控制。

理论上的 NSPredicatetextField MATCHES '.*\bfoo.*'会起作用，但我确信它会很慢。这种文本搜索似乎很常见，我想知道通常的攻击是什么？您会像我上面那样创建一个单词实体并使用“word BEGINSWITH 'foo'”谓词吗？它的工作速度会像我的原型一样快吗？ Core Data 会自动创建正确的索引吗？我找不到任何明确的方法来向持久存储提供关于索引的建议。

我在我的 iPhone 应用程序中看到了 Core Data 的一些很好的优势。故障和其他内存考虑因素允许对表视图查询进行高效的数据库检索，而无需设置任意限制。对象图管理使我能够轻松遍历实体，而无需编写大量 SQL。将来迁移功能会很好。另一方面，在有限的资源环境（iPhone）中，我担心自动生成的数据库会因元数据、不必要的反向关系、低效的属性数据类型等而变得臃肿。

我应该潜入还是谨慎行事？

我做了一个解决方案。我认为它类似于这个帖子 https://stackoverflow.com/questions/1878962/full-text-searching-in-apples-core-data-framework/2076064#2076064。我将合并源代码添加到我的 Core Data 项目中，然后创建一个不是托管对象子类的全文搜索类。在 FTS I 类中#import "sqlite3.h"（源文件）而不是 sqlite 框架。 FTS 类保存到与 Core Data 持久存储不同的 .sqlite 文件。

当我导入数据时，Core Data 对象将相关 FTS 对象的 rowid 存储为整数属性。我有一个静态数据集，因此我不担心引用完整性，但维护完整性的代码应该很简单。

为了执行 FTS，我MATCH查询 FTS 类，返回一组 rowid。在我的托管对象类中，我使用以下命令查询相应的对象[NSPredicate predicateWithFormat:@"rowid IN %@", rowids]。我避免以这种方式遍历任何多对多关系。

性能的提升是巨大的。我的数据集有 142287 行，包括 194MB（核心数据）和 92MB（删除停用词的 FTS）。根据搜索词频率的不同，我的搜索时间从几秒变为不常见词（2000 次点击）的搜索时间为 0.2 秒。

我确信我的方法存在无数问题（代码膨胀、可能的命名空间冲突、丢失一些核心数据功能），但它似乎有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何优化全文搜索的 Core Data 查询的相关文章

如何增加每次 INSERT INTO 迭代的值？

我有一个查询如下所示第 1 列位于另一列是 varchar 100 INSERT INTO TABLE1 column1 column2 SELECT MAX column1 FROM TABLE1 1 anotherColumn F
使用递归 CTE 遍历父/子树？

我被 cte 困住了我想要一个查询其中第一个父级为空上一个父级的子级将成为下一个父级的父级依此类推 WITH RESULT PARENT CHILD TNAME LEVEL AS anchor SELECT E PARENT GEN
iOS 8 启动图像文件 - 导航栏和状态栏

我正在使用 Interface Builder 制作 iOS 8 的启动图像文件我想要的启动图像非常简单我认为与设置应用程序相同顶部的导航栏带有一个空的分组 TableView 无标题等请注意我通常不使用 Interface
Phonegap 不显示警报

为什么phonegap不显示警报通知运行于 iPhone 5 1 1 phonegap Phonegap 2 1 0 0 g26d211b 山狮 10 8 2 xcode 4 4 1
iPhone只能使用SQLite数据库吗？

iPhone 可以使用 SQLite 之外的其他数据库吗比如 MySQL iPhone 只能直接在设备上使用 SQLite 作为数据库这意味着 iPhone 内部没有 MySQL 服务器但是您可以并且可以自由地拥有您自己的 MySQ
如何在条件持续时在Mysql中选择行

我有这样的事情 Name Value A 10 B 9 C 8 意思是这些值是按降序排列的我需要创建一个新表其中包含占总值 60 的值所以这可能是一个伪代码 set Total sum value set counter 0 fo
如何在我的查询中使用日期格式？

这适用于 phpmyadmin 但是当我在代码上使用时给我一个错误错误说解析错误语法错误意外的我的语法有什么问题 gt
postgresql 中的咨询锁超时

我正在从 ORACLE 迁移目前我正在尝试移植此呼叫 lkstat DBMS LOCK REQUEST lkhndl DBMS LOCK X MODE lktimeout true 这个功能 http docs oracle com cd
复制具有不同列名的 MySQL 表

我需要将 table1 中与特定列匹配的所有行复制到具有不同列名称的 table2 中例如 table1 name oldAddressBook table1 的列 name Name Surname Number table2 name
iPhone 录音时不振动

我正在修改 AurioTouch 示例我想振动手机以响应特定的声音输入我可以检测输入并printf他们但是AudioServicesPlaySystemSound kSystemSoundID Vibrate 会话期间不执行任何操作k
initWithFrame 与 initWithStyle

我想从已弃用的 TableView 中更新initWithFrame reuseIdentifier 我的表格视图使用自定义单元格到处都说要使用initWithStyle 并且它不会以任何方式改变行为或细胞initWithFrame CG
我需要进行哪些更改才能让我的表在 AppEngine 的 BigTable 上运行？

假设我有一个预订数据库其中包括users user id fname lname 和他们的tickets ticket id user id flight no 以及相关的flights flight no airline departu
何时使用 takeUnretainedValue() 或 takeRetainedValue() 来检索 Swift 中的非托管对象？

根据将 Swift 与 Cocoa 和 Objective C 结合使用 https developer apple com library prerelease ios documentation Swift Conceptual Bui
NSXMLParser 解析使用 Windows-1256 编码的 xml 文件

我想解析 Windows 1256 编码的 rss 文件但解析器没有读取它我用 UTF8 编码做了很多解析但只有这个不起作用为什么带有 Windows 1256 的 rss 文件 http youm7 com Rss asp 解决
“UITableViewCell 附件复选标记”是图像吗？

我需要定义一个自定义UITableViewCell哪里的UITableViewCellAccessoryCheckmark位于 a 的左侧UILabel 我应该将其定义为图像还是有更聪明的方法非常感谢卡洛斯这只是一个关于苹果文档 ht
具有自定义背景图像的 iPhone UITableView PlainStyle - 在代码中“完全”完成

我已经走遍了所有的地方似乎UITableView静态背景问题已有详细记录但没有人有直接的解决方案我正在建设我的TableViews完全在代码中如下所示 UIViewController tableViewController Tab
将 .sql 文件导入 SQLite

我正在尝试将大型 sql 文件导入 SQLite db 文件但出现以下错误 sqlite gt read smsCorpus en 2012 04 30 sql Error near line 23 near COMMENT syntax
PHP/MySQL - 在数据库中存储数组

我正在开发一个 PHP 应用程序它需要将各种设置存储在数据库中客户经常询问是否可以添加或更改删除某些内容这导致了表格设计出现问题基本上我有很多布尔字段它们只是指示是否为特定记录启用了各种设置为了避免再弄乱表格我正在考虑将数
选择具有按两列分组的最大值的行

我见过很多关于此类问题的解决方案尤其是这个SQL 仅选择列上具有最大值的行 https stackoverflow com questions 7745609 sql select only rows with max value on
Knex 中的表的别名

我有一个 SQL 查询两次引用同一个表并且我需要将该表别名为两个单独的别名我不太清楚如何用 Knex 来编写它有一个单词表和一个用户表 Words 表有两个外键 author id 和 winner id 引用 Users 表

随机推荐

c++ \ 将 FILETIME 转换为秒

如何将 FILETIME 转换为秒我需要比较两个 FILETIME 对象 I found this http www gamedev net topic 565693 converting filetime to time t on wi
如何将 gem 'minitest' 添加到我的测试助手中？

我是 Ruby on Rails 和测试的新手当我跑步时rake test我收到以下错误 Users jarvis rvm gems ruby 1 9 2 p180 rails3tutorial gems rack 1 3 4 lib r
OutOfMemoryError：在 WildFly 中使用 websockets 时直接缓冲内存

在我们的 WildFly 18 服务器上运行一段时间后我们遇到了以下错误 org xnio listener default I O 1 XNIO001007 A channel event listener threw an excep
通过 JSON/XML 将二进制数据发送到 (Rails) RESTful 端点？

我目前正在组装一个基于 Rails 的 Web 应用程序该应用程序仅通过 json 和 xml 提供和接收数据但是某些要求包含上传二进制数据图像的能力现在据我了解 JSON 并不完全是为了这个目的但是您通常如何解决通过应用程
JavaScript：对象的filter()

ECMAScript 5 有filter 原型为Array类型但不是Object类型如果我理解正确的话我将如何实施filter for ObjectJavaScript 中的 s 假设我有这个对象 var foo bar Yes 我想
如何使用 safe_load 使用 PyYAML 反序列化对象？

有这样的片段 import yaml class User object def init self name surname self name name self surname surname user User spam eggs
如何在javascript中用时刻（moment.js）做大于或等于？

基本上我想做一个myMoment gt yourMoment 没有myMoment isSameOrAfter并结合起来写出来isSame and isAfter有点长还有什么选择呢将时刻转换为js日期并使用 gt 比较您可以使用i
计算二次贝塞尔曲线的交点

这绝对是在挑战我的三角知识的极限有没有计算二次贝塞尔曲线和直线之间交点的公式 Example 在下图中我有 P1 P2 C 这是控制点和 X1 X2 对于我的特定计算来说它只是 X 轴上的一条直线我想知道的是 T 的 X Y 位置
当 UITextField 成为 Touch ID 完成块中的第一响应者时，不显示 iOS 键盘（在 UIRemoteKeyboardWindow 内）(iOS 10)

我最近在我的应用程序中发现了一个问题该问题似乎只发生在 iOS 10 中当以编程方式触发文本字段成为完成处理程序内的第一响应者时系统键盘不会显示特别是我从中返回的完成处理程序Touch ID 尝试这个问题最疯狂的部分是即使没有显
如何在php中将字符串转换为数组[重复]

这个问题在这里已经有答案了如何在 php 中转换数组中的字符串即 str this is string 应该是这样的 arr 0 this arr 1 is arr 2 string The str split str 3 将字符串拆分
gcc：允许未定义的符号[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我不希望 gcc 链接器将未定义的符
Select2 不使用我的 templateResults 或 templateSelection 选项

我正在尝试将 select2 ajax 调用与模板一起使用我的 ajax 运行得很好但它没有使用我的模板函数 ajax数据是 name First thing otherData asdfg name Second thing othe
翻页示例代码

是否有任何示例代码可用于像 stanza 和 iBooks 这样翻页任何帮助将不胜感激这里有一些资源可以帮助您开始使用 UIScrollView 分页 http developer apple com iphone library s
apache tomcat 8 websocket来源和客户端地址

H e l l o 社区我希望有人可以帮助我我正在使用 apache tomcat 8 0 0 RC5 和 JSR 356 Web 套接字 API 我有两个问题 1 是否可以通过 OnOpen方法获取客户端ip 2 是否可以获得连接的来
JFreeChart XYSeries 作为字符串

我正在使用 jfreechart 并尝试制作一个运行良好的 XYLineChart 我的问题是 y 标签是双值我需要字符串 My Code DefaultXYDataset result new DefaultXYDataset XYSe
ldpi、mdpi、hdpi、xhdpi 显示的 Android 初始屏幕尺寸？ - 例如：ldpi 为 1024X768 像素

我必须使用phonegap 为Android 应用程序设计启动屏幕加载时适合屏幕的图像我必须设计适合 ldpi mdpi hdpi xhdpi 等 4 种屏幕的 4 种尺寸图像谁能告诉我这些屏幕的确切像素尺寸以便我可以按该尺寸进行设
Google Drive API - 权限 - 超出速率限制。用户留言：抱歉，您已超出共享配额

我一直在使用 Google Drive API 以编程方式创建和共享文档昨天我开始在每个插入权限的请求中收到此错误消息 com google api client googleapis json GoogleJsonResponseEx
Android：跳过依赖项项目的 Gradle“testClasses”任务

我已关注本指南 https developer android com training testing unit testing local unit tests html在 Android Studio v1 4 中为我的主 Andro
如何以编程方式在 iPhone 上启动 Contacts.app

我想在用户需要添加联系人时启动 Contacts app 我的应用程序已经从联系人 API 读取如果可以避免的话我宁愿不重新实现功能我的目标是 iOS 4 0 及以上版本如果您想添加联系人请使用ABNewPersonViewCon
如何优化全文搜索的 Core Data 查询

在文本中搜索匹配单词时可以优化核心数据查询吗这个问题也涉及到 iPhone 上自定义 SQL 与 Core Data 的区别我正在开发一款新的 iPhone 应用程序它是科学数据库的手持参考工具主界面是一个标准的可搜索表格视图我希

如何优化全文搜索的 Core Data 查询

如何优化全文搜索的 Core Data 查询 的相关文章

随机推荐

热门标签

如何优化全文搜索的 Core Data 查询的相关文章