键入字符时搜索字符串

2024-03-23

我的手机中存储了联系人。假设我的联系人是

Ram

Hello

Hi

Feat

Eat

At

当我打字时'A'我应该得到所有匹配的联系人说"Ram, Feat, Eat, At".

现在我再输入一个字母T。现在我的总字符串是"AT"现在我的程序应该重用之前搜索的结果"A"。现在它应该返回我"Feat, Eat, At"

为此设计并开发一个程序。

这是三星移动开发的面试问题

我尝试解决Trie data structures。无法获得重新使用已搜索的字符串结果的良好解决方案。我还尝试了字典数据结构的解决方案，解决方案具有与Trie.

问题是如何使用先前搜索字符串的搜索结果来搜索输入的每个字母的联系人？应该使用什么数据结构和算法来有效地解决问题。

我不是要节目。所以编程语言对我来说并不重要。

状态机似乎是一个很好的解决方案。有人有建议吗？

解决方案的速度应该足以容纳数百万个联系人。

这在某种程度上取决于您要搜索的项目数量。如果列表相对较小，您可以执行以下操作string.contains检查一切。因此，当用户输入“A”时，您将搜索整个列表：

for each contact in contacts
    if contact.Name.Contains("A")
        Add contact to results

然后用户输入“T”，你依次搜索之前返回的结果：

for each contact in results
    if contact.Name.Contains("AT")
        Add contact to new search results

如果联系人列表很大，事情会变得更有趣，但对于手机中通常拥有的联系人数量（一千个就很多了！），这将非常有效。

如果面试官说“使用之前搜索的结果进行新的搜索”，那么我怀疑这就是他正在寻找的答案。创建新的后缀树比顺序搜索先前的结果集需要更长的时间。

您可以通过将子字符串的位置与联系人一起存储来对此进行优化，以便下次您要做的就是检查下一个字符是否符合预期，但这样做会使算法有点复杂（您必须将第一次搜索视为特殊情况，并且必须显式检查字符串长度等），并且在前几个字符之后不太可能提供太多好处，因为要搜索的列表的大小会非常小。纯顺序搜索contains检查速度会很快。用户不会注意到通过优化节省的几微秒。

编辑问题后更新

如果您想对一百万个联系人执行此操作，顺序搜索可能不是一开始的最佳方法。虽然我还是想尝试一下。 “足够快，可容纳一百万次联系人”提出了“足够快”究竟意味着什么的问题。在 100 万个联系人中搜索是否存在单个字母需要多长时间？用户愿意等待多长时间？还要记住，您只需show用户执行另一操作之前的一页联系人。您几乎可以肯定在用户按下第二个键之前就可以做到这一点。特别是如果您有一个后台线程执行搜索，而前台线程处理输入并将匹配字符串的第一页写入显示。

无论如何，您可以通过创建二元索引来加快初始搜索速度。也就是说，对于每个二元组（两个字符的序列），构建包含该二元组的名称列表。您还需要为每个字符创建一个字符串列表。因此，根据您的姓名列表，您将拥有：

r - ram
a - ram, feat, eat, a
m - ram
h - hello, hi
...
ra - ram
am - ram
...
at - feat, eat, at
...
etc.

我想你应该已经明白了。

该二元索引存储在字典或哈希图中。英语中只有 325 个可能的二元组，当然还有 26 个字母，所以你的字典最多有 351 个条目。

因此，您几乎可以立即查找 1 个字符和 2 个字符的名称。这对你有什么帮助？

古腾堡计划文本分析 http://www3.nd.edu/~busiforc/handouts/cryptography/Letter%20Frequencies.html表明英语中最常见的二元组仅出现 3.8% 的时间。我意识到名字不会完全共享这个分布，但这是一个相当不错的粗略数字。因此，在输入前两个字符后，您可能会使用列表中不到 5% 的名称。一百万的百分之五就是五万。只需 50,000 个名称，您就可以开始使用我最初描述的顺序搜索算法。

这种新结构的成本并不算太糟糕，尽管它足够昂贵，无论如何我肯定会首先尝试简单的顺序搜索。在最坏的情况下，这将导致您额外花费 200 万次对名称的引用。如果您构建一个 2 级 trie 而不是字典，则可以将其减少到一百万个额外引用。那需要slightly查找和显示单字符搜索结果的时间较长，但不足以引起用户的注意。

这种结构也很容易更新。要添加名称，只需浏览字符串并输入适当的字符和二元组即可。要删除名称，请通过提取二元组的名称，然后从二元组索引中的相应列表中删除该名称。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

键入字符时搜索字符串的相关文章

加密字段的部分搜索

最近我被分配了一个问题加密数据库字段例如SSN 但仍然必须保持部分搜索工作例如 SSN 123 45 6789 在数据库中被加密为 abcdxyz 当用户在搜索框中输入 2345 时它必须出现在结果中我们的数据库中有数百万条记
分配不同价值对象的算法建议

我有以下问题给定 N 个对象 N 编辑通过最公平的分配我的意思是任何两个玩家获得的物体的价值之间的差异是最小的另一个类似的情况是我有N个不同价值的硬币我需要将它们平均分配给M个玩家有时他们并没有完全分开我需要找到下一个最佳的
使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动

我正在为游戏开发 AI 我想使用MinMax算法与Alpha Beta 修剪我对它的工作原理有一个粗略的了解但我仍然无法从头开始编写代码所以我花了两天的时间在网上寻找某种伪代码我的问题是我在网上找到的每个伪代码似乎都是基于寻找最佳
Google 自定义搜索引擎未给出预期的搜索结果

我一直在尝试创建一个新的谷歌自定义搜索引擎但是当我尝试一些查询时搜索引擎没有给我预期的搜索结果在某些查询上它工作正常但在其他查询上它说没有结果我尝试添加我想要搜索的网站的 URL 但是当我尝试搜索该页面的关键字时某些页面和
高效解析个位数算术表达式

如何有效地优化运行时同时保持最小空间解析和计算 Java 中的单个数字算术表达式以下算术表达式都是有效的 eval 5 5 eval 4 4 eval 4 4 eval 7 2 3 8 eval 5 7 12 我的方法是迭代所有元素
排序数组中的最小成本路径

给定一个排序数组A e g 4 9 10 11 19 搬家费用i gt j is abs A j A i 从给定元素开始例如10 找出成本最低的路径而无需两次访问同一元素所以在这个例子中解决方案是10 gt 9 gt 4 gt 11
判断一个数是否是质数

我已经仔细阅读了有关该主题的大量代码但大多数代码生成的数字一直到输入数字都是素数但是我需要的代码仅检查给定的输入数字是否为素数这是我能够写的但它不起作用 void primenumber int number if number
这段代码的复杂度是多少？（大O）这是线性的吗？

for int i 0 i
基于正方形瓷砖直角三角形象限的坐标系中的边界框

我正在为游戏创建一个基于图块的 2D 地形系统然而我还使用游戏中的坐标需要能够将边界框映射到图块坐标中并点击边界框接触的每个图块不用担心有一个 kd 树和所有工作美好的使用定点真实世界坐标我可以将每个图块计为 2
查找集合列表中不相交集合对的数量

问题陈述如下给定一个包含 n 个集合的列表每个集合包含 k 个整数找到不相交集合对的数量假设集合的可能元素为正且上界为 c gt n 并且假设 k 我试图想出一种有效的算法来比 O kn 2 更快地解决这个问题这是简单解决方案的
背包多重约束

我有一个动态规划问题我花了几个小时研究但没有结果第一部分很简单你有一背包物品你必须最大化这些物品的价值同时将它们保持在一定的重量以下问题的第二部分是相同的只是现在也有一个项目限制例如您可以放入袋子中的物品的最大价值是多少
计算具有特定子集大小的集合分区

给定一组n元素我需要找到该集合的所有分区k大小几乎相等的子集例如对于一个包含 7 个元素和 3 个子集的集合我只需要其中有两个子集每个子集包含 2 个元素和一个子集包含 3 个元素的分区我不想要一个包含 1 2 和 4 个元素
布隆过滤器的实现

使用布隆过滤器我们将获得空间优化 cassandra 框架也有 Bloom Filter 的实现但具体来说这种空间优化是如何实现的呢您可以使用以下示例了解它如何节省空间假设我在 Google Chrome 团队工作我想向浏览器添
合并排序代码不起作用并显示异常

public static void Merge int arr int p int q int r int n1 q p int n2 r q int L new int n1 int R new int r n2 for int i 0
将简单的单色绘图图像转换为二维文本数组

我正在尝试开发一种算法将简单的单线图像即迷宫转换为文本二维数组例如下面的图像它将被转换为以下文本数组
使用一个或多个标准 FIFO 队列实现延迟队列 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 延迟队列是一种队列其中每条消息都有
是否可以有效地计算 lambda 演算项？

我最近用 lambda 演算编写了很多程序我希望能够实时运行其中一些程序然而尽管趋势函数范式基于 lambda 演算和 B 约简规则但我找不到一个不是玩具不以效率为目的的评估器函数式语言应该很快但我所知道的那些语言实际上并不提
找到与另一个子集和匹配的最小子集和

我有一个现实世界的问题不是家庭作业需要找到集合 A 的子集之和等于其他集合 B 的子集之和一个非常相似的问题有一个有用的答案is here https stackoverflow com questions 443712 algor
通过 DFS 查找图中的强连通分量

我正在阅读有关 BFS 和 DFS 的图算法当我分析通过DFS在图中查找强连通分量的算法时我想到了一个疑问为了找到强连通分量书 Coremen 做了什么首先它在图上运行 DFS 以获得顶点的完成时间然后再次以完成时间的降序在图的
光线追踪三角形

我正在用java编写一个光线追踪器并且我能够追踪球体但我相信我追踪三角形的方式有问题据我了解这是基本算法首先确定射线是否与plane三角形已打开剪裁所有点使它们与三角形位于同一平面上因此xy以平面为例根据沿着新平面向任意方

随机推荐

jenkinsfile 管道按代理分组阶段

我有什么我正在尝试使用两种不同的代理来运行我的詹金斯管道我想在同一个代理上执行某些流程但到目前为止我无法执行此操作因为代理定义只有 2 个选项我可以在管道顶部执行或者我可以将代理定义到每个阶段我有这个 pipeline age
用 CSS 使图像变灰？

使用 CSS 让图像显示为灰色的最佳方法如果有是什么即不加载单独的灰色图像版本我的上下文是表格中的行在最右侧的单元格中都有按钮并且某些行需要看起来比其他行更亮因此我当然可以轻松地使字体变亮但我也希望使图像变亮而不必管
Python pandas系列：将浮点数转换为字符串，保留空值

转换为字符串后如何保留空值我正在处理社会安全号码需要在浮点数和字符串之间来回切换 import pandas as pd import numpy as np x pd Series np nan 123 np nan 456 dtyp
如何使用phpmyadmin导出所有数据库

可以使用phpMyadmin一次性导出所有数据库吗如果不是最好的方法是什么提前致谢以下是使用 phpMyAdmin 导出所有 mySQL 数据库的步骤 2015 年 12 月随着 phpMyAdmin 的发展添加了新功能打开
当 setup.py 使用 Python 版本 3 解释器运行时，如何构建 py2 轮包？

我有一个应该是 Python 的包仅版本 2但需要构建运行版本 3 解释器 The setup py这个包的内容看起来像点击 from setuptools import setup setup python requires lt 3 0
“编辑前 200 行”不适用于 SQL Server 16.0 - Express Edition

我正在尝试在 SQL Server Express 版本中编辑前 200 行但它返回的是空白文件如下所示显示带有禁用工具的空白文件 https i stack imgur com CvpH7 png 我已经在本地安装了这个 SQL
将渐变效果应用于模糊视图

如何在 Swift 中添加具有模糊效果的渐变视图我可以很轻松地向视图添加渐变层 CAGradientLayer 我还可以单独添加模糊视图 UIVisualEffectView 如何将两者结合起来创建一个模糊视图该视图还具有渐变元素其中
当我单击画布并拖动鼠标时，光标会变为文本选择光标。我怎样才能防止这种情况发生？

这是一个小提琴 http jsfiddle net MZ9Xm http jsfiddle net MZ9Xm 注意以下情况发生在 Chrome 22 0 1221 1 中但不会发生在 Firefox 14 0 1 中 Ubuntu l
Java 随机崩溃（可能的罪魁祸首：ntdll.dll？）

我有一个用 Java 编写的程序并使用 Windows 任务计划程序设置为每 5 分钟运行一次它执行 C Program Files Java jre7 bin javaw exe 并传递 jar 文件和所有命令行参数在大多数情况下
如何安全地镜像 git 存储库？

我想通过后台作业镜像一些 git 存储库 git clone mirror and git remote update不会保留通过强制推送未引用的对象但我也想保留这些对象以防黑客攻击有没有什么工具可以执行安全的 git 镜像虽然缺少
Tone.PitchShift 和 Howler.js 问题

我喜欢在我的 Meteor 应用程序中使用 Howler js 然而播放速率功能导致了我不想要的音调变化我只想延长时间并保持音调因此我的解决方案是对其进行音调变换以纠正音调看起来很简单这就是我选择使用的原因https to
在 Qt 中显示 QImage 的灰度并调整其大小

我已经能够使用如下内容在 Qt 中的标签中显示图像 transformPixels 0 0 1 imheight imwidth 1 sets unsigned char imageData unsigned char fullCharAr
与Netty相比，vert.x如何实现卓越的性能？

最近的TechEmpower 性能基准 http www techempower com benchmarks 一直在 Netty 之上展示 vert x 有时数量很大根据其网站 vert x 使用 Netty 来实现大部分网络 IO
jquery：无法获取div的“value”属性

这是我的 chrome javascript 控制台的屏幕截图展示了我的困境我真的无法理解为什么我无法获取值属性 class 属性工作得很好所以我认为同样应该适用于 value 我在我的应用程序中测试的代码 coffeescrip
没有WebRTC的nodeJS中的简单SIP电话

您好我需要实现类似 SIP 电话的功能但使用不带 WebRTC 的经典 SIP 大多数 JS 库都专注于基于 websockets 和 WebRTC 的 SIP 但在我的基础设施中我没有 WebSocket 有像 JsSIP 这样的
PHP preg_match_all：提取逗号分隔列表

例如我有以下字符串 WIDGET TEST abc 456 我希望能够使用 preg match all 返回逗号分隔参数的数组有人可以帮我解决我需要的正则表达式吗我已经尝试过并且返回以下查询 a b preg match all
方案中的延续传递风格？

我遇到了这段代码在维基百科上 http en wikipedia org wiki Continuation passing style define pyth x y k x x lambda x2 y y lambda y2 x2 y2
图像 PropertyItems 和已处置的 MemoryStream

我正在加载一个Image from a byte using MemoryStream并通过检查图像来获取有关图像的信息ProperyItems 但在这样做的过程中我注意到一些奇怪的行为其中一些图像的PropertyItems正在消失
sqlite：如何获取组计数

我在网站上有一个用户操作的 SQLite 表每一行都是网站上的相同操作只是时间日期不同并用用户 ID 标记该表有超过 2000 万条条目我了解如何使用按用户 ID 进行分组的功能来获取用户计数即 A 执行了 3 次操作 B 4
键入字符时搜索字符串

我的手机中存储了联系人假设我的联系人是 Ram Hello Hi Feat Eat At 当我打字时 A 我应该得到所有匹配的联系人说 Ram Feat Eat At 现在我再输入一个字母T 现在我的总字符串是 AT 现在我的程序应该重用

键入字符时搜索字符串

编辑问题后更新

键入字符时搜索字符串 的相关文章

随机推荐

热门标签

键入字符时搜索字符串的相关文章