搜索是过拟合的生成;生成是欠拟合的搜索

2023-11-01

神经搜索的最大竞争者可能来自于一种甚至不需要向量嵌入作为中间表示的技术 —— 一种直接返回你想要的结果的端到端技术。

"那么,谁将是神经搜索最大的竞争对手?"

 本文作者:肖涵,Jina AI 创始人兼 CEO 

谁将是神经搜索最大的竞争对手?

就在 2019 年的圣诞节前几天,我坐在一个狭小的会议室里,周围是我们种子风投公司的投资委员会。我们已经在办公室待了几个小时,来回地讨论。这是最后一轮令人紧张的路演,以确保我的神经搜索倡议获得所需的 200 万美元的孵化资金:Jina AI 的诞生就悬在一线,这是一个成败攸关的时刻。

其中一位从 2005 年就在纽约谷歌工作的合伙人问了我一个我永远不会忘记的问题:

"谁将是您最大的竞争者?"

“谷歌,Elastic,Algolia,……” 我自信地回答道,这是我早前准备过的问题。然后我咬紧牙关,只是等着他们问我那些无聊的陈词滥调的问题,比如“你怎么与谷歌竞争?”在他们回答之前,我补充说:“但更严峻的竞争可能来自一项不需要嵌入作为中间表示的技术 —— 一项端到端技术,它能直接返回您想要的结果。”

但他们没有听懂我的意思,他们坚持着那些老套问题。一直在追问我如何与谷歌竞争。

3 年过去,时间和“常识”都已经发生改变,他们理解了我所说的技术。

这项技术就是 生成式人工智能而 神经搜索是判别式人工智能

在那时,也就是在谷歌发布 BERT 的 15 个月后,生成式人工智能还不是可扩展且高质量搜索的答案。而神经搜索是一个灵活的框架,它可以轻松地使用密集的嵌入表示,并结合多个子任务,是当时搜索多模态数据的唯一现实的方法。

多模态人工智能异军突起

自 2021 年以来,我们在行业中看到了从单模态人工智能到多模态人工智能的巨大范式变革

Jina AI愿景中的未来AI应用

多模态人工智能的兴起归功于近几年机器学习技术的进步:表征学习和迁移学习。

  • • 表征学习使模型为所有模态创建共同的表征。

  • • 迁移学习使模型首先学习基本知识,然后在特定领域进行微调来改进学习。

2021 年,我们看到了 CLIP,一种捕获图像和文本之间对齐关系的模型;2022 年,DALL·E 2 和 Imgen 通过文本提示生成了高质量的图像。由 Stable Diffusion 领导的 AI 生成艺术从一个社区嘉年华开始,现在已经演变成一场工业革命。这是一座刚刚探出头的巨大冰山。在未来,我们将看到更多 AI 应用超越单一数据模态,利用不同模态之间的关系。临时方法正在像恐龙一样消失,因为数据模态之间的界限变得模糊无意义。

但是,在开始想象花哨的高级人工智能应用之前,有两个基本问题我们必须先解决:搜索和生成。

或者我应该说,搜索,还是生成?

搜索和生成的二元性

搜索和生成是一枚硬币的两面,是一种二元性。

为了理解这一点,让我们以 text-to-image 和 image-to-image 为例,看看以下两个函数:

def foo(query: str) -> List[Image]:
  ...

def bar(query: Image) -> List[Image]:
  ...

那么,foo 和 bar 是什么?

  • • 当它们是搜索时, foo 表示以文搜图(CBIR),bar表示以图搜图。

  • • 当它们是生成时, foo 表示从文本提示 Prompt 到 AI 生成图像,bar 指的是从初始图片到 AI 生成图像。

那么,你能分辨下面的区别吗?搜索结果是哪个,AI 生成的结果是哪个?以及这真的重要吗?搜索是找到你需要的东西;AI 生成是制作你需要的东西。如果一个系统返回了你需要的结果,它是来自搜索还是 AI 生成,这真的重要呢?

"嗯,但是数据库的完整性确实很重要," 你可能会反驳。"因为我不想在我的商品搜索结果中看到虚构的商品图像。" 有时人们确实关心数据库的准确性,但解决它很容易,我们只需要过拟合一个生成式人工智能模型。我们可以让模型记住它在训练数据中看到的所有内容,失去所有普遍性和泛化能力。它只会返回训练数据中的内容。你看,这样你就拥有了一个可靠的搜索系统。

生成式人工智能会使这种压抑性限制得到缓解。让模型即兴创作,让我们拥抱随机性,让感觉胜过保真性。生成式 AI 只是一个欠拟合的搜索系统。

硬币不断旋转着,它最终会落在哪边?它还重要吗?

总结

随着越来越多的大型语言模型(LLM)和生成人工智能的兴起,使用 LLM,特别是预训练的语言模型(PTLM),已经成为一种流行的机制,可以根据需要从自由形式文本中提取知识。尽管语料库中存在报告偏差问题,并且对查询缺乏鲁棒性,但 LLM 在一些相当成功的下游任务,比如基于人格的对话、叙事故事生成和隐喻生成。COLING 2022 最近也有一项工作,探索了像 CLIP 这样的跨模态模型作为常识知识库。你可以在这里找到我关于这篇论文的笔记。https://jina.ai/news/coling2022/

Are Visual-Linguistic Models Commonsense Knowledge Bases?

在写这篇文章的前一天,我读到 Yann LeCun 的推文,讲述了 Galactica —— 一个具有搜索界面的生成式人工智能:

从快速测试的效果来看,它在模仿学术语气方面做得不错,但很快就偏离了主题,并且领域知识有限。尽管如此,这对于生成人工智能来说仍是一个里程碑。

我们抛出硬币,看着它在空中翻滚,一端接着一端翻转。我们的目光从未从它的轨迹上移开。当它到达弧线的顶点时,我们都知道结果不再重要。

拓展资料

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

搜索是过拟合的生成;生成是欠拟合的搜索 的相关文章

随机推荐

  • 分享一款开源堡垒机-jumpserver

    JumpServer是由FIT2CLOUD 飞致远 公司旗下一款开源的堡垒机 这款也是全球首款开源的堡垒机 使用 GNU GPL v2 0 开源协议 是符合 4A 规范的运维安全审计系统 使用 Python 开发 遵循 Web 2 0 规范
  • java basefont_itext 文本域 字体样式设置

    使用acroFields setFieldProperty nameField textfont baseFont null 的方式不能加粗 因为第三个参数必须是BaseFont类型 不能是Font类型 可以使用下面的方式加粗 BaseFo
  • 判断环形链表是否有环??返回环形链表的入口点!!

    上次笔者写了一篇大概有7个题的链表相关的题目 解析 感觉还不错 感兴趣的各位老铁 可以点一下链接进行欣赏 做几个与链表相关的题吧 https blog csdn net weixin 64308540 article details 128
  • 牧师与魔鬼 -- version2 动作分离

    目录 一 基本操作演练 1 下载 Fantasy Skybox FREE 构建自己的游戏场景 2 写一个简单的总结 总结游戏对象的使用 二 编程实践 1 牧师与魔鬼 动作分离版 面向对象的游戏编程 动作管理器的设计思想 动作管理器的设计类图
  • 【LeetCode算法系列题解】第21~25题

    CONTENTS LeetCode 21 合并两个有序链表 简单 LeetCode 22 括号生成 中等 LeetCode 23 合并K个升序链表 困难 LeetCode 24 两两交换链表中的节点 中等 LeetCode 25 K 个一组
  • 2018.1.22-2018.(几年前帖子,私密变公开后时间就变了)

    成为全职程序员 每天9点至17 50 中午11 30 13 00休息 不过我逐渐加班 第一天没加班 第二天加班一小时 第三天2小时 第4天3小时 编译了CGAL OPENCV PCL BOOST等 CGAL的LEDA库没法用 PCL读取点云
  • 【全文检索】sqlite-fts4和pgsql的全文检索对比

    sqlite fts4和pgsql的全文检索对比 一 sqlite fts4 建表语句 插入数据 全文检索 前缀查询 数据更新 二 postgreSQL 全文检索 建表语句 to tsvector 和to tsquery 构建索引 查询结果
  • 正则表达式常用参数

    正则表达式中常用的模式修正符有i g m s U x a D e 等 它们之间可以组合搭配使用 i 不区分 ignore 大小写 例如 abc i 可以匹配 abc aBC Abc g 全局 global 匹配 如果不带g 正则过程中字符串
  • 3.移植uboot-使板卡支持nor、nand

    在上一章 我们添加了nor nand启动后 uboot启动出如下图所示 上面的Flash failed 是属于uboot第二阶段函数board init r 里的代码 代码如下所示 位于arch arm lib board c 第二阶段 v
  • Mac 编译报错 Undefined symbols for architecture x86_64

    问题描述 使用cmake编译项目时 报错内容为 Undefined symbols for architecture x86 64 Obstacle run referenced from main in 1 o Obstacle Obst
  • Mysql 执行计划

    EXPLAIN 参考 https blog csdn net wanbin6470398 article details 82256436 https blog csdn net weixin 41558728 article detail
  • SpringBoot+MyBatis-Plus配置动态数据源

    1 pom xml添加依赖
  • xml与datatable类型互换

    已测 private DataTable ConvertXMLToDataSet string xmlData StringReader stream null XmlTextReader reader null try DataSet x
  • AES解码:BadPaddingException: pad block corrupted异常

    我是AES cbc模式 解码时遇到这个错误 解决问题的关键是把输出方式 由hex改为base64 public static String decode String secret String iv String content thro
  • 4399笔试印象

    C语言游戏开发工程师笔试已通过 16道选择 平衡二叉树 计算机网络tcp 哈希冲突的处理方法线性探测法 计算机神经网络的sigmod函数 等 三道编程 第一道忘记了 第二道贪心方法 题目轮廓 有5 10 15面额的纸笔用最少的张数来花费够多
  • 什么是 JxBrowser

    JxBrowser是一个商业跨平台 Java 库 可以让您将基于 Chromium 的 Web 浏览器控件集成到您的 Java Swing JavaFX 或 SWT 桌面应用程序中 以显示使用 HTML5 CSS3 JavaScript 构
  • IDEA--tomcat日志乱码

    0 实际使用效果 我tomacat乱码的问题 本来通过方法二改好了 某次测试 误以为乱码问题再次出现 其实不是乱码 于是使用方法一 对tomcat的logging进行修改 改成GBK那个 反而致使控制台乱码 真的乱码 又使用了一遍方法三 还
  • Android Toast的几种使用方式

    Toast是Android中常用的组件 下面介绍下Toast使用的几种方式和注意事项 Toast的使用方式简单来说有下面五种 1 默认的显示 第一个参数 当前的上下文环境 可用getApplicationContext 或Activity的
  • [计算机网络]——知识点总结

    个人网站 code宝藏 欢迎访问 如果大家觉得博主写的还不错的话 可以点点关注 及时获取我的最新文章 非常感谢大家的支持与点赞 笔记整理自小林coding的 图解网络 作者写的很不错 我自己整理一下方便后期复习 文章目录 计算机网络体系机构
  • 搜索是过拟合的生成;生成是欠拟合的搜索

    神经搜索的最大竞争者可能来自于一种甚至不需要向量嵌入作为中间表示的技术 一种直接返回你想要的结果的端到端技术 那么 谁将是神经搜索最大的竞争对手 本文作者 肖涵 Jina AI 创始人兼 CEO 谁将是神经搜索最大的竞争对手 就在 2019