Solr应用之电商商品搜索备忘

2023-11-02

     把以前做电商商品搜索的经验归档一下。电商的搜索功能大体上比较相同,从京东、苏宁、易讯等大型电商都可以观察出来。电商搜索功能大致分为几块:

1. 商品搜索、列表的展示,带排序功能;可能有些产品会要求一个商品不同规格也聚合成一个展示。

2. 类别导航区块、属性过滤区块;类别导航通常在页面的左上方,属性过滤块通常在商品展示区上方。

3. 搜索框自动联想;敲了bing能提示“饼干”、“冰块”之类的

4. 查询词扩展;搜完一个词在显眼区域提供相关查询词,比如搜了“苹果”,会提示“是否需要搜  苹果手机套  iphone5s” 等


    第1,2点,以前在公司写的一篇:http://mlcsdev.iteye.com/blog/2048371 。电商的分词不太重要,单字都可以接受,只是需要把一定的词分出来,保证同义词可用。另外一块如何设置较好的默认排序,是需要根据用户搜索历史来进行学习的,这点还没做到。

有关3,4点solr的suggest组件也可以使用,但功能不满足要求,之前的博客提过实现方案。

自动联想,可以参考之前博客: http://blog.csdn.net/lgnlgn/article/details/8816218

或者参考美团的策略,或者直接使用nlpcn的"搜索提示",我的办法其实和nlpcn的办法是一样的。

查询扩展,可以参考我的博客:http://blog.csdn.net/lgnlgn/article/details/8760785 

那么联想和扩展的词从哪来,通常是从搜索日志整理,实在不行可以从商品标题上取。

另外还有一个拆词搜索,就是一个query因为太乱什么都没搜到,需要根据query里面部分有意义的词分别列出几个商品。这个比较简单,就直接按分词的思路,把query里面出现的词拿出来单独搜就行了。

有耐心的也可以看以前录的视频:http://v.youku.com/v_show/id_XNjA5NTM0NzMy.html


   这里只是介绍功能实现,1,2点如果比较大的数据量,可能会需要多考虑一些潜在的性能问题,但一般中小电商可以不必担心系统方面的问题。




本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Solr应用之电商商品搜索备忘 的相关文章

  • SORL 方面字段按降序值排序

    我正在使用带有分面过滤器的 SOLR 6 5 1 我的查询有 facet limit 1 gt 生成所有可能的构面值 facet sort index gt 不按出现次数而是按值本身对分面值进行排序 例如 一个方面将整数作为值 特别是字段包
  • 如何使用 Solr Provider 控制 Sitecore ContentSearch 中嵌套查询的优先级?

    版本详情 我正在使用 Sitecore 7 5 build 141003 使用 Solr v4 7 作为搜索引擎 索引服务器 我还使用标准 Sitecore Solr 提供程序 没有自定义索引器 目标目标 我使用 Sitecore Cont
  • 将 Nutch 爬虫与 Solr 结合使用

    我可以将 Apache Nutch 爬虫程序与 Solr 索引服务器集成吗 Edit 我们的一位开发人员从这些帖子中提出了一个解决方案 运行 Nutch 和 Solr http wiki apache org nutch RunningNu
  • Solr 索引与存储

    我对太阳能场的索引和存储属性的行为有点困惑 例如 如果我在 Schema xml 中有以下内容
  • solr 中的文本字段排序

    我正在使用 solr 3 4 并希望 solr 搜索结果在文本字段上排序 如何实现像 int 自然排序一样对文本字段进行排序 有没有办法在查询时将文本字段转换为int 我的排序字段是字符串类型 我希望它在排序时表现得像 int 字段 我无法
  • 另一个日期时间问题

    我目前有一个这种格式的日期 2010 03 03 10 39 18 这是一个TIMESTAMPMySQL 中的字段 我需要为名为 Solr 的搜索引擎提供以下格式的日期 1995 12 31T23 59 59Z 以下是他们网站上有关日期的一
  • Solr 中的多值字段排序

    我有一个 Solr 索引 将每个产品的价格存储在多值字段中 我需要按价格对结果集进行排序 其中价格从低到高 从高到低 我尝试对价格进行排序 它显示错误您无法对 multivalued True 字段进行排序 下面是我的 solr XML
  • MIME 类型/内容类型,用于在 IE 和 Firefox 中使用 Excel 打开 CSV 文件

    我在 Excel 中识别并打开 CSV 输出时遇到问题 在我的 Web 应用程序中 我有一个 java servlet 它将搜索结果返回给用户 搜索结果由 Apache Solr 服务器提供 GUI 前端有一个选项 允许用户请求 CSV 格
  • 客户端断开连接后 Solr 查询继续吗?

    我对 Solr 长期运行查询遇到的问题有一个理论 但我不知道它是否正确 也不知道如何测试它 我正在使用 cURL 从应用程序查询 Solr cURL 的配置方式是 如果 Solr 在 3 秒内未发送响应 它将放弃并断开连接 从而允许托管 c
  • 使用 sunspot/solr 搜索多个模型

    我已经能够成功地实现基本的全文搜索 但是当我尝试使用范围 with statements 时 任何涉及多对多关系模型的查询似乎都不适合我 我知道相关行位于数据库中 因为我的 sql 语句确实返回了数据 然而 太阳黑子查询不会返回任何结果 我
  • 需要在 java api 中的 Solr 搜索中搜索文本及其周围的几行

    我正在使用 solr 7 7 2 并且我使用 solrj 在 Solr 中编写了一个 Java 程序 该程序在一个巨大的文本文件中搜索单词 我使用以下代码来显示代表整个文本的搜索结果 SolrQuery params new SolrQue
  • openNLP 与 Solr 集成时出现异常

    我正在尝试将 openNLP 与 Solr 6 1 0 集成 我配置了架构和 solrconfig 文件 详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
  • Solrcloud Zookeper 设置:等待 4000ms 后未找到注册的领导者,集合:c1 切片:shard2

    我使用 solr 4 10 3 我通过 java 中的嵌入式 jetty 服务器启动 solr 我正在尝试使用 2 个分片 领导者 配置 solrcloud 我有一个外部动物园管理员设置 我在启动 solr 时指向动物园管理员实例 如下所示
  • Solr 在 TrieDateField 上按年份过滤

    我的 Solr 模式有一个字段类型tdate班级的solr TrieDateField
  • 使用 ConcurrentUpdateSolrServer 需要哪些 jar?

    目前使用 solrServer new CommonsHttpSolrServer serverUrl 和这些罐子 apache solr core 3 6 0 apache solr solrj 3 6 0 commons codec 1
  • Solr 不搜索整数?

    我目前正在使用 Solr 为电子商务网站开发搜索引擎 所以我在 schema xml 中得到这两个字段
  • 自定义存储库的 Spring Data Solr 优先级

    我需要在 Spring Data Solr 自定义存储库中实现以下内容 X 或 Y 和 Z 我当前的代码如下 Criteria criteria new Criteria x is X VALUE criteria criteria or
  • Data-config.xml 和 mysql - 我只能加载“id”列

    我在 Windows Server 2012 上安装了 Solr 5 0 0 我想将表中的所有数据加载到 solr 引擎中 我的 data config xml 如下所示
  • 如何减少solr内存使用?

    我在我的应用程序中使用 solr 只有数百个文档 内存占用80M左右 如何减少 80M 并不多 事实上它几乎是最低限度 你不会比这个低很多 影响内存使用的一些因素 输入文档尺寸 多线程文档更新 缓存大小 分面查询 Sorting 参考 ht
  • 如何知道 Solr Optimize 何时完成?

    我正在使用 Solr php client 通过 php 与 Solr 进行通信 这段代码触发solr优化命令 solr gt optimize 请问有没有什么方法可以确定优化完成了 这都是因为我的网站上有一个管理页面 我每天必须手动优化

随机推荐

  • blibli APP项目 环境搭建以及部署

    blibli APP 前言 1 Docker Compose 2 微服务系统的部署 前言 该项目所用到的技术 Docker Docker Compose ElasticSearch springboot springcloud redis
  • 关于vue分页加载、通过监听滚动条方式分页,单页vue

    准备工作vue官方文档 介绍 Vue js
  • 【状态估计】基于增强数值稳定性的无迹卡尔曼滤波多机电力系统动态状态估计(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据 文章讲解 1 概述 文献来源 摘要 为了提高用于电
  • 梁乾东:4.29黄金震荡暴涨还能持续上升吗?黄金原油独家策略解析

    消息面解析 现货黄金周3走出V型行情 先是跌破1770美元 晚间开始回升 美联储决议后 黄金短线上涨至1780美元 日内现货白银呈现震荡走势 凌晨短暂上涨后跌幅较大 截至收盘 现货黄金上涨0 28 报1781 20美元 盎司 现货白银跌0
  • 【JavaScript高级】浏览器原理:渲染引擎解析页面步骤、回流和重绘、composite合成、defer与async

    文章目录 渲染引擎解析页面的步骤 解析1 HTML解析过程 解析2 生成CSS规则 解析3 构建Render Tree 渲染树 解析4 布局layout和绘制Paint 回流和重绘 特殊解析 composite合成 script元素和页面解
  • 回调函数排序异常原因

    回调函数排序异常原因 问题所在 解决方案 参考我的这篇博文c 回调函数排序 回调函数 我之前的代码是这样写的 存在问题 问题所在 将数组传递到其他函数中 再使用sizeof 数组名 得到的不是数组的完成长度了 往往会短一些 不要在子函数中对
  • 简单Java前后端分离项目部署

    返回导航页 返回导航页 简单部署 直接运行jar包 1 需要配置安全组 2 服务器需要防火墙开启端口 涉及到的相关命令解释 firewall cmd zone public add port 8080 tcp permanent 开放808
  • Games101第三次作业(渲染管线分析、着色模型分析、双线性插值)

    文章目录 前言 一 作业要求 二 渲染管线分析 1 main函数 1 1main cpp的功能 2 draw函数 2 1draw函数的作用 2 2viewspace下的顶点的法向量 3 rasterize triangle函数 3 1ras
  • VirtualBox上安装Linux的基本配置

    这里主要记录下网络方面的配置 一般情况下都是如上的配置 只有界面名称那里 根据实际情况而定 如果你是有线网 那就要变一下 当系统安装好了 输入可以查询ip地址的命令 一般新安装的linux都不支持ifconfig命令查看 所以直接用 ip
  • java-快速查找文件,文件内容工具

    背景 工作日积月累 PC电脑文件越来越多 有时想找一个文件都不知道在哪 很烦恼 因此写了一个工具可以帮快速查找一些文件 减少查找文件的时间 应用场景 查找关键字文件名 文件目录 查找关键字文件内容 查找关键字特殊文档内容 xml doc p
  • web移动端-2-流动布局-案例学习

    总结 参考 黑马 移动web day3 总结京东M站 1 适配问题 移动端设备尺寸不一致 2 流式布局 随着浏览器尺寸的改变做自适应 掌握 3 当放到移动端预览 通过谷歌浏览器的模拟器 真机调试 服务器和手机设备在同一个局域网内容即可 4
  • 【Google】免翻!Google 最强插件下载中心!

    文章目录 一 极简插件 二 GugeAPPs 三 Extfans 四 插件安装方法 今天我送大家3款超强 Google 浏览器下载插件网站 可以完美解决 Google 浏览器应用中心在国内无法登陆的尴尬境遇 整理不易 点赞多多支持 一 极简
  • DataAnalysis-Maggie-Lecture1

    Lec1 5 31 目标 学习多种数据分析算法和技巧 数据分析应用 期中 project 期末 术语区别 数据科学是领域 统计分析是数学子学科 ML是让电脑自己通过数据和经验改进算法 AI是一种模仿人类的ML 数据挖掘 是处理数据然后发现模
  • Source Insight 4.0安装后首次打开报错

    老早就听说过代码阅读神器Source Insight一直没使用过 今天终于要用到了 兴冲冲的去官网下载安装了Source Insight4 0 安装一切顺利 好感动 Linux上经常各种缺依赖 我都怕了 可能是我比较菜 双击打开 报错 不对
  • Linux ps命令常见实战用法

    文章目录 一 基本介绍 1 1 基本介绍 1 2 常用参数 1 3 字段含义 二 常见用法 2 1 查看所有进程 2 2 查看特定进程信息 参考资料 Linux中的ps命令是Process Status的缩写 当程序运行在系统上时 我们称之
  • 毕业设计-基于机器视觉人脸识别技术课堂签到系统的设计与实现-OpenCV

    目录 前言 课题背景和意义 实现技术思路 一 软件设计 二 系统实现 实现效果图样例 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力 近几年各个学校要求的毕设项目越
  • 【机器学习】机器学习算法的随机数据生成

    文章目录 一 前言 二 numpy随机数据生成API 2 1 rand d 0 d 0 d0
  • BeanUtils数据封装与表单JavaBean

    一 BeanUtils工具的解释 1 Apache的Commons组件中 提供了一个实用的工具类BeanUtils 利用它可以方便的将表单数据值填充值Bean中 2 javax servlet ServletRequest getParam
  • Java垃圾回收机制

    众所周知 Java是一个编译一次就可在不同系统上运行的语言 这主要得益于JVM虚拟机 JVM担任着Java内存自动管理的重任 JVM 的 动内存管理主要是进 对象内存的分配与回收 最核 的功能是 堆 内存中对象的分配 与回收 堆 是垃圾收集
  • Solr应用之电商商品搜索备忘

    把以前做电商商品搜索的经验归档一下 电商的搜索功能大体上比较相同 从京东 苏宁 易讯等大型电商都可以观察出来 电商搜索功能大致分为几块 1 商品搜索 列表的展示 带排序功能 可能有些产品会要求一个商品不同规格也聚合成一个展示 2 类别导航区