谷歌打响全面反击战!官宣AI重构搜索、新模型比肩GPT-4,朝着ChatGPT微软开炮...

2023-10-27

点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达87bd056809a18b428e355a439bab6ce2.jpeg

明敏 丰色 发自 凹非寺
量子位 | 公众号 QbitAI

万众瞩目,谷歌的反击来了。

现在,谷歌搜索终于要加入AI对话功能了,排队通道已经开放。

a04e94e9c9190536e9bb22dac7d2f94b.gif

当然这还只是第一步。

大的还在后面:

全新大语言模型PaLM 2正式亮相,谷歌声称它在部分任务超越GPT-4。

Bard能力大更新,不用再排队等候,并支持新语言。

谷歌版AI办公助手也一并推出,将在Gmail中抢先亮相。

谷歌云也上线多个基础大模型,为行业提供更进一步的生成式AI服务……

在最新一届I/O开发者大会上,谷歌的大放送真的太震撼。

有网友直呼:

AI大战全面开启。

36f1b514209d8d64577c4b1cee0c0ea4.png

有人甚至表示:

现在我后悔为ChatGPT付费了。

e2858d5c6264876526cfd747768f595a.png

一场发布会结束,谷歌股价上涨超4%。

db430b8f4d3465ec8a2424ae9c85a22b.png

PaLM 2部分任务超越GPT-4

毫无疑问,PaLM 2是今年I/O大会的重中之重,由皮查伊亲自做介绍。

96ff1788aa0ae86fe4baa827bdc265b3.png

目前的Bard以及谷歌超过25个AI产品和功能,现在都由PaLM 2作为底层技术支持。

作为谷歌目前最先进的大模型,PaLM 2基于Pathways架构,是PaLM的升级版,通过JAX在TPU v4上构建。

据介绍,PaLM 2接受了100多种语言的训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。

谷歌表示,PaLM 2的数据集中有海量论文和网页,其中包含非常多数学表达式。在这些数据的训练后,PaLM 2能轻松解决数学问题,甚至是制作图表。

编程方面,PaLM 2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。

6ef3d4fccab1c13951d81c3f06854ed8.png

这一次谷歌一并推出了四种不同size的PaLM 2。

他们用不同的动物来体现规模大小。最小的是“壁虎”,最大的是“独角兽”。

b54fb0845cd95d789195684fd5ea9ac6.png

其中“壁虎”版本是非常轻量级的,能在移动设备上快速运行,包括离线状态;每秒可处理20个token。

7130cf62a25251dbf2adbc507fc794ab.png

DeepMind副总裁在I/O大会前的新闻发布会上表示:

我们发现模型并不总是越大越好,这也是为什么我们决定提供一系列不同规模的模型。

这意味着微调PaLM 2会更加方便,由此它也能支持更多产品和应用。

在I/O大会上,谷歌就宣布了现在已经有超过25个产品和应用正在使用PaLM 2的能力。

具体的表现形式,就是Duet AI

6ec8977cf5b831e90772a5b1934cced6.png

可以将它理解为微软365 Copilot的对标产品,是一个能够内嵌在各种办公软件中的AI助手。

谷歌在发布会现场已经展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。

包括根据提示补充邮件内容、生成PPT、根据提示生成图片素材、一键生成表格等。

2a9b6664b95658c0189f2755cd3d09a8.gif

同样,这个AI助手也能提供编程帮助。基于谷歌云,它能实时推荐、纠错代码块,并且以对话方式解答编程问题,目前支持Go、JavaScript、Python和SQL。

另外基于PaLM 2,谷歌还推出了一些专业领域大模型。

谷歌的健康团队打造了Med-PaLM 2。它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

6e17e0b8633b45f16c671481e064204d.png

目前谷歌正在尝试让它具备多模态能力,比如自己检查X光片后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。

d1eae6852b2482cefab03c2ea16a872c.gif

另一个专业大模型是Sec-PaLM 2。

这是一个面向网络安全维护的大模型,它能分析和解释潜在的恶意脚本,并检测脚本的危险性。

那么,在展示了PaLM 2一众卓越能力后,就该聊聊怎么开放使用了。

谷歌表示,现在可以通过PaLM API接口、Firebase和Colab使用PaLM 2。

Bard全面开放,支持图片、集成自家地图等应用

对标ChatGPT的Bard终于取消排队试用,在全球180+国家和地区进行全面开放了。

新增黑暗模式,备受程序员好评:(手动狗头)

4b65ae78cf84c907256de2fbf7b07a8c.png

除了扩大访问范围,Bard也在英文之外,新增直接用日语和韩语对话的功能。中文看起来还得再等下一波——谷歌表示,很快就会新增到40种语言版本。

51299b4c5e0c89a867f1e172f18d36f6.png

由于从今天起,Bard将全面接入PaLM 2,所以它在编程和推理上面的能力也有了很大的提升,代码生成、调试和解释都更加专业(获得程序员认可的那种)。

当你让它用python写一段国际象棋中的“四步杀”(scholar’s mate)招式,里面参考了别的代码,它会给出相关链接,方便你查看。

a0f13656d1cfd7dccd87f50ec593b8f9.png

你可以就它给出代码中某个不懂的函数进行进一步提问,问它能否再改善一下,或者是要求它将所有内容都合并的一个代码块中。

47ecff687917921e161ac6507e04f51d.gif

不过,最惊喜的当属应广大开发者要求,加入了一键导入功能

现在,你可以将Bard生成的代码直接导出到Colab。

6cdf364803c6baf4ad2f1c812f9f5528.png

除了代码,你用Bard生成的任何内容,比如电子邮件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。

对了,Bard现在的回答中也支持图片了。拿来问旅游攻略最方便不过:

ad85b2eb7a220068d04f31bced81aa71.gif

除了它能用图片回答你,你也能直接丢给它图片,比如上传一张两只狗狗的照片,让它来帮你编点好玩的故事:

a39f2d49f844545ce3ffc1d2e990f7f3.gif

这个功能由Google Lens(一款能让机器学会“看图说话”的AI应用)提供支持。

除了Google Lens,Docs、Drive、Gmail、地图等多个谷歌自家的应用能力也整合到了Bard之中。

比如在Bard的回答中直接用谷歌地图查看几所大学的地理位置:

e280779539952ec828da602319805deb.png

有种现在要用谷歌的各种产品,只用Bard一个入口就够了的感觉。

除了自家应用,Bard这次还把Adobe Firefly给搬了上来,各种有版权的创意图像用对话就可以“信手拈来”:

98ffe28462aa7c7c4e4ef4ebc0c182b0.gif

搜索重构,加入AI对话

千呼万呼,谷歌搜索终于开启了AI对话的能力。

“一家带有一个不到3岁孩子和一只狗的家庭来说,去布莱斯峡谷还是拱门国家公园游玩更好?”

对于这个问题,搁以前,你可能需要自己把它拆成各种小问题去搜索引擎整理大量信息,最终才能找到答案。

现在谷歌让你尽量一步到位。

如图所示,谷歌搜索没有简单地搬运搜出来的答案,而是将孩子和狗这两个因素都考虑进去给出整理后的回答,比如它说:

布莱斯峡谷有两条狗能进入的环路,对婴儿车也十分友好;拱门国家公园则大部分路段都不允许宠物进入;两个地方都要求宠物拴上皮带等。

22225a088aa72937a5cd8d31fad78095.png

每句话都有具体的依据链接供查看:

2137be1a1544bc6fd06c1a7c162a9fe3.png

除此之外,它还会显示了来自不同网站网友发布的攻略链接。

最重要的是,你可以对它的回答进行进一步对话式的提问,点击“ask for a follow up”按钮即可。

用新的谷歌搜索进行购物也非常有趣,它号称可以帮你迅速做出理性的购买决定。

比如当你想要一辆“适合5英里山地通勤的自行车”,它会先告诉你挑选之前需要考虑的重要因素,比如:

一看设计:电动自行车、公路自行车和混合动力自行车等适合通勤;

二看电机和电池,三看减震用的悬架,有山路的通勤需要应对裂纹和颠簸带来的冲击等。

然后再给你推荐合适的车,推荐时还会给出具体产品说明、最新评价、价格和图片等全面信息。

c73721875939445a30af65579ffc686f.png

你也可以进行进一步提问,比如只要红色电动自行车,它会进一步优化回答。

755c1727eff5783515d97548924a7a0f.png
9df22211b825d3da380492326d7ebbe8.png

这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。

值得一提的是,谷歌直言更新后的AI搜索界面照样会植入广告,但放心:它只会在专用广告位中出现,不会混进你的搜索结果中。

最后,这个新功能目前还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。

三大基础模型上线谷歌云

今年I/O大会,谷歌云的内容也同样抢眼。

在更新了一大波AI能力后,谷歌为自家云端机器学习平台Vertex AI,上新了三款大模型:

  • Codey:text-to-code,帮助程序员写代码

  • Imagen:text-to-image,生成高质量图像

  • Chirp:speech-to-text,方便沟通

cb2a4802fb93c1955e6550efc2900757.gif

这三种模型的能力其实在今天的发布会上都有展示过,比如生成代码、谷歌照片智能编辑等。

f70eedb8a36d34e2e0b12527b8414493.gif

除此之外,在Vertex AI上现在还能使用文本和图像的嵌入式API。它支持将文本和图像数据转换为多维数值向量、映射语义关系,从而允许开发者创建出更加有意思的应用。

另一个重大更新则在RLHF上,谷歌表示他们是首个将此功能作为托管服务放到端到端机器学习平台行的。好处是能让企业结合RLHF快速训练奖励模型,用于微调基础模型,这对于大模型在行业应用中的准确性提升非常关键。

除了模型方面,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。

除了这些,谷歌这次还带来售价1799美元(合人民币约1万2)的首款折叠屏手机等新硬件产品,以及接入AI功能的Android 14系统(比如提供信息回复建议什么的),这里就不一一展示了。

总的来看,作为第15届I/O大会,谷歌这次着实给大家带来了非常多的干货。

值得一提的是,这次上台介绍的发言嘉宾,已不见Jeff Dean的身影,他前几日刚刚职级变动。

作为从前Google AI最代表性发言的高管,在AI 2.0浪潮里,将何在?

谷歌是否还能在大模型和AI搜索领域中奋起追上,也值得期待。

你对这次谷歌的反击,满意吗?

d16eb860d47e713ef6b6b9c05913a71e.png

outside_default.png

点个在看 paper不断!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

谷歌打响全面反击战!官宣AI重构搜索、新模型比肩GPT-4,朝着ChatGPT微软开炮... 的相关文章

随机推荐

  • zookeeper 系列(2) 启动流程

    虽然天天在看源码 但很久没有写博客了 从这周开始写点系列 不写文章 就整些流程图吧
  • Linux部署Seata详细过程记录

    Seata服务搭建 Seata官方文档地址 Seata安装包下载地址 依赖版本说明地址 SpringCloudAlibaba版本对应组件版本说明 详细参考官网文档 当前使用Spring cloud alibaba对应的seata版本为v1
  • 中国需要怎样的智慧城市联盟?中外41家联盟组织大起底

    自2009年 智慧地球 概念的提出 智慧城市 作为支撑该系统性设想的组成部分 正在全球范围内 被多数发达和发展中国家所接受并在城市层面开展实践 开展智慧城市规划建设是数字城市 平安城市 数字化 信息化和物联网等 的升级性目标 为有效保障智慧
  • 1.3.6 手写数字识别之训练调试与优化.md

    文章目录 概述 一 计算模型的分类准确率 二 检查模型训练过程 三 加入校验或测试 四 加入正则化项 4 1 过拟合现象 4 2 导致过拟合原因 4 3 过拟合的成因与防控 4 4 正则化项 五 可视化分析 5 1 使用Matplotlib
  • 2022最新软件测试八股文,能不能拿心仪Offer就看你背得怎样了

    前言 鉴于目前测试就业越来越严峻 内卷也成了测试领域的代名词了 我的一个HR朋友告诉我 由于门槛较低 现在普通测试岗 偏功能 的投递比已经将近100 也就是一个岗位差不多有百分简历投进来 所以现在还想从事软件测试行业的小伙伴们 想要心仪的工
  • qt QTimer 提示 不能在另外一个线程停止

    发送 信号 停止 timer 提示 QObject killTimer Timers cannot be stopped from another threadQObject QObject Timers cannot be stopped
  • Spring之Ioc工作流程

    springIoc容器创建流程 在AbstractApplicationContext refresh 中描述了创建ioc的过程 1 前期准备校验参数等 prepareRefresh 2 创建beanFactory工厂对象 还把配置文件中的
  • sort函数数组排序(c++方法)

    sort函数的调用需要头文件 include 从小到大排 例如 a 50 2 3 5 1 1 想让它按照从小到大的顺序排列 那么就可以这么写 sort a a 5 然后数组就会变成 1 1 2 3 5 具体代码如下 include
  • 小菜鸡刷CTF

    一个小菜鸡的CTF成长史 本人小菜鸡一枚 刚入门CTF 不对 应该是脚刚刚沾上了CTF的边边 就只是在刷攻防世界中的题目 无奈脑子太笨 记性太差 只好将题目整理下来 代码多有借鉴 求勿喷 新手练习 题目一 base64 题目来源 poxlo
  • Kotlin手写RxJava变换符

    Kotlin手写RxJava变换符 本文链接 点击这里进入 1 核心点 中转站存储之前的数据 2 三行代码实现RxJava 使用create map observer fun main create构造出RxJavaCore存放 lambd
  • Open3D 入门教程

    文章目录 1 概述 2 安装 3 点云读写 4 点云可视化 4 1 可视化单个点云 4 2 同一窗口可视化多个点云 4 3 可视化的属性设置 5 k d tree 与 Octree 5 1 k d tree 5 2 Octree 5 2 1
  • Redis密码相关知识总结

    背景 工作中 生产环境的Redis集群都是无密码的 存在安全隐患 现在需要对Redis集群进行密码设置 相关工作总结如下 基础知识 requirepass redis实例自身的连接密码 当客户端请求连接当前Redis服务器时 需要使用的密码
  • 【Yarn】Yarn 是如何提交 MapReducer程序到Yarn集群的

    文章目录 1 概述 3 1 案例 3 2 waitForCompletion 3 3 submit 3 4 connect 3 5 submitJobInternal 3 6 submitJob 3 7 createApplicationS
  • 第五章:多重循环及程序调试

    第五章 多重循环及程序调试 一 什么是多重循环 多重循环 一个循环体内又包含另一个完整的循环结构 例子 while 循环条件1 循环操作1 while 循环条件2 循环操作2 do 循环操作1 do 循环操作2 while 循环条件2 wh
  • 基于libVLC的视频播放器(支持RTSP协议)

    VLC Media Player是一款优秀的播放器 大多数多媒体开发人员都使用过 VLC是一款开源的 跨平台的 可扩展的 多媒体播放器 流媒体服务器及框架 可播放大多数多媒体文件 以及DVD 音频CD VCD及各类流媒体协议 现更名为VLC
  • 自学黑客(网络安全),一般人我劝你还是算了吧

    一 自学网络安全学习的误区和陷阱 1 不要试图先成为一名程序员 以编程为基础的学习 再开始学习 我在之前的回答中 我都一再强调不要以编程为基础再开始学习网络安全 一般来说 学习编程不但学习周期长 而且实际向安全过渡后可用到的关键知识并不多
  • vue深度css样式

    vue 2 gt gt gt 或者 deep 或者 v deep vue 3 deep class
  • PCL点云库学习笔记(搜索方法)

    PCL点云库学习笔记 搜索方法 一 k d tree 二 八叉树 一 k d tree 我们所有的k d树都是三维空间的 k d树的每个级都使用特定维度拆分所有子级 在树的根部 所有子项都将根据第一维进行拆分 即 如果第一维坐标小于根 则它
  • 奇数求和

    include
  • 谷歌打响全面反击战!官宣AI重构搜索、新模型比肩GPT-4,朝着ChatGPT微软开炮...

    点击上方 视学算法 选择加 星标 或 置顶 重磅干货 第一时间送达 明敏 丰色 发自 凹非寺量子位 公众号 QbitAI 万众瞩目 谷歌的反击来了 现在 谷歌搜索终于要加入AI对话功能了 排队通道已经开放 当然这还只是第一步 大的还在后面