如何修改Solr给出的搜索结果页面？

2024-03-03

我打算做一个利基搜索引擎。我使用 apache-nutch-1.6 作为爬虫，使用 apache-solr-3.6.2 作为搜索器。我必须说，网络上有关这些技术的更新信息非常少。

我按照这个教程http://wiki.apache.org/nutch/NutchTutorial http://wiki.apache.org/nutch/NutchTutorial并已在我的 ubuntu 系统上成功安装 apache 和 solr。我还成功地将种子 url 注入到 webdb 并执行爬网。

Using solr interface at http://localhost:8983/solr/admin, I can also query the crawled results. But this is the output I receive. enter image description here .

Am I missing something here, the earlier apache-nutch-0.7 had a war which generated a clear html output like this. enter image description here . How do I achieve this... Or if anyone could point me to a latest tutorial or guidebook, highly appreciated.

有几件事：

如果您刚刚开始，请不要使用 Solr 3.6，直接使用最新的 4.1+。许多事情发生了变化，并添加了许多新功能。
您似乎是在说您将直接将 Solr + UI 暴露给一般 Web - 这是一个非常糟糕的主意，因为 Solr 完全不安全并且允许基于 Web 的删除查询。您确实需要中间有一个业务层。
Solr 4.1 有一个漂亮的管理 UI，还有一个 /browse 页面，显示如何使用 Velocity 来执行 Solr 支持的页面。或者看看类似的东西黑光计划 http://projectblacklight.org/有关如何通过 Solr 获取 UI 的示例。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何修改Solr给出的搜索结果页面？的相关文章

在 Java/Android 中检查字符串是否包含 URL 的最佳方法是什么？

在 Java Android 中检查字符串是否包含 URL 的最佳方法是什么最好的方法是检查字符串是否包含 com net org info 其他或者有更好的方法吗 url 输入到 Android 中的 EditText 中它可以是粘
为什么这不会绘制图像？

我想做的是当我运行应用程序时它会启动线程并且图像显示 3 秒 3000 毫秒然后线程停止运行图片路径正确图片文件存在线程本身运行但是图像似乎没有显示可能出什么问题了这是我的代码 package org main impo
32 位数字中 1 的数量

我正在寻找一种在 32 位数字中包含 1 数量的方法之间不使用循环任何人都可以帮助我并向我提供代码或算法吗这样做提前致谢 See Integer bitCount int http java sun com javase 6 doc
Lambda 表达式更慢？

我有下面这段代码 PriorityQueue
正则表达式或用单个空格替换多个空格的方法

你能告诉我有没有办法在java或spring中用单个空格替换多个空格有相同的 stringUtils 函数吗 like 1 test test test test 2 test test test test 3 test test tes
清理 IntelliJ 中构建的 Play 框架

我有一个拼写错误conf routes文件导致 Play Framework 生成错误命名的类重建项目并运行Invalidate Caches并没有解决 IntelliJ 中的问题当我手动运行时重新生成了不正确的类文件play clea
何时使用 clone() 以及 addAll() 和 add() 的实际工作原理

我正在使用 Java 和 MySQL 我的项目中有大约 60 个交易屏幕我曾经用过add and addAll 复制的功能ArrayList 例如 List
如何在生产中安全地更改会话 cookie 域或名称？

我们最近意识到我们的会话 cookie 正在被写入我们网站的完全限定域名 www myapp com 例如 MYAPPCOOKIE 79D5DB83 domain www myapp com 我们希望将其切换为可以跨子域共享的cookie
测试 Hessian remoting-servlet.xml

我们使用 Hessian 来实现富客户端和服务器之间的通信由于移动和重命名 remoting servlet xml 中的条目有时会与实际的类名不匹配因此我正在寻找一种简单的方法来测试远程处理 xml 有没有简单的方法可以做到这一点
飞碟中的外部 CSS

我想知道如何在 Flying Saucer 中包含外部 CSS 在此之前THB我检查了所有可用的链接StackOverflow但它们没有帮助这就是为什么我自己做这个的原因 TestCSS xhtml重命名版本TestCSS html 所以
具有多个注释的方法上的 AspectJ 切入点

使用加载时编织纯 AspectJ 我们有2个注释 Time and Count 以及一些带注释的方法 Time name myMethod1Time Count name myMethod1Count public void myMeth
将 try catch finally 块放入另一个 finally 块中

try catch finally try catch finally 上面的代码好不好是的你可以这样做实际上在处理想要正确关闭的流时您甚至需要这样做 InputStream in try catch finally try in
Android：如何停止监听电话监听器？ [复制]

这个问题在这里已经有答案了可能的重复 Android 为什么 PhoneCallListener 在活动完成后仍然存在 https stackoverflow com questions 11666853 android why phon
如何在 Google 地图中创建自定义地图？

我正在尝试创建一个包含我家地图的 Google 地图应用程序卧室浴室厨房等使用 GPS 我会找到我现在在家里的位置并尝试获取到我卧室的方向步行距离您可以使用Google的API来获取方向我需要知道的是如何添加我家的自定义地
为什么我们在同一台服务器上使用多个应用程序服务器实例

我想这是有充分理由的但我不明白为什么有时我们会在同一物理服务器上放置例如 5 个具有相同 Web 应用程序的实例这与多处理器架构的优化有关吗 JVM 或其他允许的最大内存限制嗯过了很长一段时间我又看到这个问题了一台机器上的多个 J
java.lang.OutOfMemoryError：尝试将 Java 对象转换为 Json 字符串时的 Java 堆空间

我尝试将 csv 文件转换为 200K 对象的 Json 文件其中对象代表 csv 中的 1 行我在 32 位上安装了 Java 并且项目配置 VM 参数 Xmx1024m 但是我得到 Exception in thread main
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip
使用基于Optional内容的流

我从不受我控制的服务获取可能为空的地图并且想要处理它比方说过滤映射并减少到我需要的单个元素问题是否有从Optional到Stream的链接我尝试过除其他外 return Optional ofNullable getMap
Java：将秒转换为分钟、小时和天[重复]

这个问题在这里已经有答案了任务是输出应如下所示最好回显输入您输入了 500 000 秒即 5 天 18 小时 53 分钟 20 秒 5天18 53 20小时我该怎么做呢最容易理解和做到的方法是什么讲师还说没有硬编码我不太
Android，Volley请求，响应阻塞主线程

使用 Volley 处理较大响应时会发生一些不好的事情 String url AppHelper DOMAIN service pages profile update json this infoTextView setText getS

随机推荐

R 错误：`n()` 只能在 dplyr 动词内部使用

我收到错误的代码 numCrimesByLSOA lt crimes gt select LSOA code LSOA name Crime type gt group by LSOA code gt summarise Num crime
问题：nginx：[emerg] mkdir()“/var/cache/nginx/client_temp”失败（13：权限被拒绝）

我正在尝试跑步Nginx on Openshift但面临这个目录权限问题由于此错误容器未创建以下权限设置为手动创建的文件 drwxr xr x 3 root root 79 Dec 22 02 50 etc nginx drwxr x
车祸最低门槛

我正在使用加速度计来检测车祸我遇到了检测车祸所需的最小阈值的问题检测车祸所需的最低阈值是多少 Override public void onSensorChanged SensorEvent event float x event va
垂直或水平调整 div 大小

如何在不使用 css 属性的情况下调整 div 垂直或水平大小仅使用纯 javascript 代码从高度或宽度调整大小 HTML div div This is the top side s content div div div div
如何强制 Git (2.5+) HTTP 传输更喜欢 SPNEGO 而不是基本身份验证？

Summary 我正在使用 Git for Windows 2 5 1 通过 Kerbesized Git 服务器进行身份验证当我使用表单中的 URL 时https el2 gitlab sa c kkm GrammarTools git
导出到 Apps 脚本 web 应用程序的图表数据为空

我有一个 Google 表格我正在使用它作为我的团队正在开展的项目的数据库我想做的是使用这些数据在 Google 网站上构建不同的屏幕例如我已经能够添加一个显示所有活动项目的下拉列表选择项目后将返回并显示 HTML 表格现在
如何在 VSC 中注释/取消注释 jsx（使用键盘 `cmd /`）？

谁能告诉我如何在 VSC 中注释 JSX 代码我看了下面列出的文章似乎都没有给出具体的解决方案而且票证似乎已经关闭声称评论取消评论功能已在VSC上得到妥善解决但是按照建议尝试以下方法后我仍然遇到问题在 VSC 上禁用 su
二维数组的线性排序

我是 C 编程新手正在尝试编写一些排序程序我编写了线性正常排序的程序现在我想做一个程序来对二维数组进行排序即如果矩阵是 4 6 1 3 2 9 5 7 8 那么结果应该是 1 2 3 4 5 6 7 8 9 由于您希望 2D 数组
控制 genoPlotRplot_gene_map 中的边距

我正在制作一个plot gene map数字由genoPlotR R包它给出了一个水平系统发育树其中与每个叶子对齐的是一个基因组片段这是一个简单的例子说明了我的用法和问题 The plot gene map函数需要一个ade4的包p
使用 django Rest 框架在验证步骤之前修改数据

我有一个简单的Model存储创建它的用户ForeignKey 该模型有对应的ModelSerializer and ModelViewSet 问题是当用户提交一个POST要创造一个新记录 user应该由后端设置我尝试覆盖perform c
如何（可移植地）使用 C++ 类层次结构和动态链接库

好吧我知道可移植性不是 C 的强项但我必须让我的代码在 Mac 和 Windows 上运行我已经提出了一种解决方案但它并不完美我有兴趣看看是否有人可以提出更好的解决方案我需要在多个 DLL 包中使用类层次结构例如我有一个抽象
iOS 6 视图加载期间的设备方向处理？

我有一个标签栏应用程序我使用的是 XCode 4 3 3 我已经升级到 4 5 2 带有 iOS6 的东西我的代码在shouldAutorotateToInterfaceOrientation每个视图都会检查当前设备方向并正确放置所有
如何在 XAML 中构建控件网格？

我正在尝试按照规范在 WPF 中构建 UI UI 用于编辑项目集合每个项目都有一个可编辑的字符串属性以及 UI 需要显示的可变数量的只读字符串它可能看起来像这样或者根据数据可能有不同数量的文本标签列文本列的数量是完全可变的可
由于通道 url 不兼容，设备未接收 C# Windows 推送通知

经过几个小时的试用我仍然无法向我的应用程序发送推送通知这就是我到目前为止所做的激活服务于https appdev microsoft com 得到了SID 我们调用它ms app s 1 23 4 12345678901 123456
GCC 值得在 Windows 上使用来替代 MSVC 吗？

我目前在 Windows 上使用 Visual Studio 2010 使用 C 进行开发在 C 11 正式发布后我开始使用 MSVC 中已经提供的一些功能但是正如预期的那样绝大多数新更改都不受支持我想也许即将推出的 Visua
Javascript 是“缓存”操作吗？

我正在用 Javascript 实现 Levenshtein 距离函数我想知道用维基百科的示例星期日和星期六运行它需要多少时间所以我用了console time and console timeEnd 以确定函数执行所花费的时间
水晶报表 - 最后一页为空白

我有一个水晶报告生成时最后一页是空白的除了页脚指示当前页面以及报告标题仅当倒数第二页上显示的数据完全填满页面时才会发生这种情况有人知道为什么会这样吗当您选中复选框时新页面之后您会看到一个图标就在它旁边这个图标代表配方工作坊
从 AngularJS 中的两个资源调用返回 $promise 以延迟路由更改

Use Case 使用路由提供程序在解析中返回 promise 将避免 UI 加载后弹出数据但是我在处理两个不同的资源调用并将其作为单个数组返回时遇到问题目前的实施当前的实现有效但要求控制器需要两个资源 var app angu
无法使用 MAVEN 进行构建，出现错误 - 无法执行目标 org.apache.maven.plugins:maven-compiler-plugin:3.1:compile

我一直在尝试使用maven 构建代码但我遇到了一个错误该代码可在此 github 存储库中找到谷歌播放爬虫 https github com Akdeniz google play crawler 我的maven显示的系统配置如下 A
如何修改Solr给出的搜索结果页面？

我打算做一个利基搜索引擎我使用 apache nutch 1 6 作为爬虫使用 apache solr 3 6 2 作为搜索器我必须说网络上有关这些技术的更新信息非常少我按照这个教程http wiki apache org nut

如何修改Solr给出的搜索结果页面？

如何修改Solr给出的搜索结果页面？ 的相关文章

随机推荐

热门标签

如何修改Solr给出的搜索结果页面？的相关文章