C# 查找相关文档片段以显示搜索结果

2024-02-04

在为我正在构建的网站开发搜索时，我决定采用廉价且快速的方法，使用 Microsoft Sql Server 的全文搜索引擎，而不是像 Lucene.Net 这样更强大的引擎。

不过，我想要的功能之一是谷歌式的相关文档片段。我很快发现确定“相关”片段比我意识到的更困难。

我想根据找到的文本中的搜索词密度来选择片段。所以，本质上，我需要找到文本中搜索词最密集的段落。其中一个段落是任意数量的字符（比如 200——但这并不重要）。

我的第一个想法是在循环中使用 .IndexOf() 并构建一个术语距离数组（从先前找到的术语中减去找到的术语的索引），然后......什么？将任意两个、任意三个、任意四个、任意五个连续数组元素相加，并使用总和最小的元素（因此，搜索项之间的距离最小）。

这看起来很混乱。

有没有比我想出的更成熟、更好或更明显的方法来做到这一点？

尽管它是用 Java 实现的，但您可以在此处查看解决该问题的一种方法：http://rcrezende.blogspot.com/2010/08/smallest-relevant-text-snippet-for.html http://rcrezende.blogspot.com/2010/08/smallest-relevant-text-snippet-for.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C# 查找相关文档片段以显示搜索结果的相关文章

为什么这个 Web api 控制器不并发？

我有一个 Web API 控制器里面有以下方法 public string Tester Thread Sleep 2000 return OK 当我调用它 10 次使用 Fiddler 时我预计所有 10 次调用都会在大约 2 秒后
在 CPP 类中将 C 函数声明为友元

我需要在 C 函数中使用类的私有变量我正在做这样的事情 class Helper private std string name public std getName return name friend extern C void in
如何在类文件中使用 Url.Action() ？

如何在 MVC 项目的类文件中使用 Url Action Like namespace 3harf public class myFunction public static void CheckUserAdminPanelPermissi
从复选框列表中选择循环生成的复选框中的一个复选框

抱歉我的英语不好在我的 ASP NET 网站上我从 SQL 表导入软件列表看起来像这样但实际上要长得多 Microsoft Application Error Reporting br br Microsoft Applicatio
如何将 .txt 文件中的数据转换为 xml？ C＃

我在一个文本文件中有数千行数据我想通过将其转换为更容易搜索的内容来轻松搜索我希望 XML 或其他类型的大型数据结构尽管我不确定它是否是最好的对于我的想法每行的数据如下所示第 31 册托马斯乔治 32 34 154 每本书都不是
不同 C++ 文件中的相同类名

如果两个 C 文件具有相同名称的类的不同定义那么当它们被编译和链接时即使没有警告也会抛出一些东西例如 a cc class Student public std string foo return A void foo a Stude
获取没有显式特征的整数模板参数的有符号/无符号变体

我希望定义一个模板类其模板参数始终是整数类型该类将包含两个成员其中之一是类型T 另一个作为类型的无符号变体T 即如果T int then T Unsigned unsigned int 我的第一直觉是这样做 template
从网页运行 ClickOnce 应用程序，无需用户操作

我们有一个基于 Java 的 Web 应用程序以及用 C 编写的相同应用程序如果 java 检查器发现客户端计算机上没有安装 Java 则应该运行该应用程序这个想法是运行 C 单击一次 http en wikipedia org wik
为什么 n 按位和 -n 总是返回最右边的位（最后一位）

这是Python代码片段 1 1 1 2 2 2 3 3 1 看来任何n n总是返回最右边最后位我真的不知道为什么有人可以帮助我理解这一点吗这是由于负数以二进制表示的方式称为二进制补码表示创建某个数字 n 的补码换句话说创
如果输入被重定向则执行操作

我想知道如果我的输入被重定向我应该如何在 C 程序中执行操作例如假设我有已编译的程序 prog 并且我将输入 input txt 重定向到它我这样做 prog lt input txt 我如何在代码中检测到这一点一般来说您无法判
将 Word 转换为 PDF - 禁用“保存”对话框

我有一个用 C 编写的 Word 到 PDF 转换器除了一件事之外它工作得很好有时在某些 Word 文件上后台会出现一条消息保存源文件中的更改 gt 是否取消但我没有对源文件进行任何更改我只想从 Word 文件创建 PDF
如何在 C# 中创建异步方法？

我读过的每一篇博客文章都会告诉您如何在 C 中使用异步方法但由于某些奇怪的原因从未解释如何构建您自己的异步方法来使用所以我现在有这段代码使用我的方法 private async void button1 Click object se
Oauth2中如何同时撤销RefreshToken和使AccessToken失效

我正在使用 Owin Oauth2 授权和资源服务器相同开发单页面应用程序 AngularJS Net MVC Json Rest API 的身份验证流程我选择了 Bearer Token 路由而不是传统的 cookie session
模板类的模板构造函数的 C++ 显式模板特化

我有一个像这样的课程 template
C++ 对象用 new 创建，用 free() 销毁；这有多糟糕？

我正在修改一个相对较大的 C 程序不幸的是并不总是清楚我之前的人使用的是 C 还是 C 语法这是在一所大学的电气工程系我们 EE 总是想用 C 来做所有事情不幸的是在这种情况下人们实际上可以逃脱惩罚但是如果有人创建一个对象
如何解压 msgpack 文件？

我正在将 msgpack 编码的数据写入文件在编写时我只是使用 C API 的 fbuffer 如我为示例删除了所有错误处理 FILE fp fopen filename ab msgpack packer pk msgpack pa
Visual Studio 2015 - Web 项目上缺少共享项目参考选项卡

我从 MSDN 订阅升级到 Visual Studio 2015 因为我非常兴奋地阅读有关共享项目的信息当我们想要做的只是重用代码时不再需要在依赖项中管理 21382 个 nuget 包所以我构建了一个测试共享项目其中包含一些代码
C++：二叉树所有节点值的总和

我正在准备面试我被一个二叉树问题困住了我们如何计算二叉树所有节点中存在的值的总和优雅的递归解决方案伪代码 def sum node if node NULL return 0 return node gt value sum nod
在 Win32 控制台应用程序中设置光标位置

如何在 Win32 控制台应用程序中设置光标位置最好我想避免制作句柄并使用 Windows 控制台功能我花了整个早上沿着那条黑暗的小巷跑它产生的问题比它解决的问题还要多我似乎记得当我在大学时使用 stdio 做这件事相对简单但我
EntityFramework 6.0.0.0 读取数据，但不插入

我创建了一个基于服务的数据库 folderName gt Add New Item gt Data gt Service based Database文件到 WPF 应用程序中然后我用过Database First方法并创建了Person

随机推荐

在函数作用域末尾执行代码的简单方法[重复]

这个问题在这里已经有答案了在测试代码中我偶尔想设置模拟一些全局变量在测试范围结束时我想恢复这些变量例如 BOOST AUTO TEST CASE HttpClientCsrf std string csrfSave Http
反序列化 PHP 会话数据

我正在使用 CodeIgniter 3 x 和数据库会话驱动程序我想访问data列那BLOB类型这是我的 blob 数据 ci last regenerate i 1435420891 identity s 13 email prote
匿名共享内存？

是否有一种 POSIX y 方法来分配不与特定文件名绑定的共享内存 IE 仅通过 UNIX 域套接字传递 SCM RIGHTS 消息才能在进程之间共享内存 None
Asp.net 单元测试中缺少对 System.Web.Mvc 的引用？

我最近为我的 Asp NET MVC 应用程序做了一些单元测试或者我尝试这样做它一直告诉我类型 System Web Mvc Controller 是在未引用的程序集中定义的您必须添加引用程序集 System Web Mvc 版本
在 AJAX 请求期间显示微调框？

展示旋转器的最佳方式是什么我准备了一个 div id spinner 它在加载过程中应该是可见的你使用 jQuery 吗如果是这样你可以使用 ajaxStart 和 ajaxStop http docs jquery com Ajax
迭代 String.prototype

我知道for in循环可以帮助迭代对象原型和集合的属性事实是我需要迭代String prototype 虽然console log String prototype 当我这样做时显示完整的原型 for var prop in Stri
如何在 ASP.Net 应用程序中使用 HTTPS

我想在 ASP NET Web 应用程序中使用 HTTPS 但仅限于 Login aspx 页面如何才能做到这一点首先获取或创建证书获取 SecureWebPageModule 模块http www codeproject com A
Fluent nhibernate：如何映射具有类型为接口的属性的实体？

我有一个像这样的实体 public class Employee public int ID get set public IAccountManager AccountManager get set 我还为 DefaultAccountM
WP8.1 HttpClient Stream 仅获取 65536 字节数据

我正在尝试在 Windows 运行时为 win8 1 和 wp8 1 的 MediaElement 编写一个实时 flv 流解复用器我已经完成了解复用代码 flv 文件可以正确解复用为 h264 和 aac 标签数据当我尝试播放网络文件
Xcode 斯威夫特。如何在基于视图的 NSTableView 中以编程方式选择单元格

我可以单击一个单元格并编辑其内容但是可以通过编程方式选择单元格而不是单击选择单元格基本上为单元格焦点提供准备编辑的机会 StackOverflow 上有人问了关于 UITableView 的同样问题给出的答案是 let inde
如何从 Python 执行程序？ os.system 由于路径中的空格而失败[重复]

这个问题在这里已经有答案了我有一个Python脚本需要执行外部程序但由于某种原因失败了如果我有以下脚本 import os os system C Temp a b c Notepad exe raw input 然后它失败并出现以下
如何使用 GeoTools 创建具有纬度、经度和半径的圆？

现在我有 Polygon circle geometryBuilder circle myLong myLat radiusInMeters 10 它创建纬度 28 456306 长 16 292034 半径 500 一个具有巨大纬度和经
JavaScript 中用于格式化数字的正则表达式

我需要使用 JavaScript 在网页上显示格式化的数字我想对其进行格式化以便在正确的位置有逗号我该如何使用正则表达式来做到这一点我已经得到这样的东西 myString myString replace d 3 g 1 然后意识到
将 select 语句包含在事务中有何意义？

将 select 语句包含在事务中有何意义我认为 select 语句只是从数据库中获取数据它们没有机会回滚某些内容因为您无法更改数据那么这是否意味着我们永远不需要在事务中放置 select 语句我对吗 Thanks 你是对的
2 个 TextView，左侧带省略号，右侧带 nowrap，单行

第一次在这个论坛发帖希望一切顺利我正在为我所在城市的公共交通开发 Android 应用程序这是我所拥有的 http s28 postimg org i8cdifwgd actual png short destination next
读取嵌入双引号和逗号的 CSV 文件

我正在尝试使用 data table 包中的 fread 函数读取脏 CSV 文件但在字符串值中嵌入双引号和逗号时遇到问题即引用字段中存在未转义的双引号以下示例数据说明了我的问题它由 3 行行和 6 列组成第一行包含列名称 SA
base64编码长度参数

我正在解码一个 Base64 字符串修改它然后用 Ruby 重新编码当我重新编码时问题是 ruby 编码库在 60 个左右的字符后添加换行符我怎样才能告诉它没有每行最大字符数限制 val QmFzZTY0IGlzIGEgZ2VuZ
无法使用InputStream读取API读取所有字节？

我在 java 套接字中读取图像字节时遇到问题我的 iOS 客户端正在此处发送图像它需要读取总字节并将其作为图像存储在服务器端当我通过 iOS 模拟器测试时效果非常好因为如果我在模拟器中测试它会将图像发送到46 577 字节
PouchDb find：为什么我的索引没有被使用？

我正在使用 PouchDb 和插件 PouchDb find 在 ionic Web 应用程序中查询本地数据库几乎在每个用例中当我创建索引时我都会在查询时收到以下警告 docs warning no matching index fo
C# 查找相关文档片段以显示搜索结果

在为我正在构建的网站开发搜索时我决定采用廉价且快速的方法使用 Microsoft Sql Server 的全文搜索引擎而不是像 Lucene Net 这样更强大的引擎不过我想要的功能之一是谷歌式的相关文档片段我很快发现确定相关

C# 查找相关文档片段以显示搜索结果

C# 查找相关文档片段以显示搜索结果 的相关文章

随机推荐

热门标签

C# 查找相关文档片段以显示搜索结果的相关文章