垂类模型大有前景,但AGI却给自己“挖了个坑”

2023-11-06


00f7bd963a5b4db59f52217774c02271.jpg巨量模型是个“坑”,但垂直模型不是。

 

@数科星球原创


作者丨苑晶


编辑丨大兔

2023年4月,GPT-5的相关消息引起了一阵轰动。彼时,人们对巨量大模型既有期待、也有恐惧。更有甚者,认为人类历史或许将因此而画上终止符。


但很快,从业者便发现,巨量大模型存在“不经济”、“不适用”的缺陷。随即,垂直模型开始兴起。以至于,在2023年的Q2和Q3,垂直模型正在大批量的出现。


除已发布的垂直模型外,据数科星球(ID:digital-planet)初步测算,未来还将有更多产品问世。


真理越辩越明,在对话多位行业资深人士后,我们发现了垂直模型的未来。它不仅限于提供超越个体智力的“认知对话框”,还可以结合具体行业赋能千行百业。


现在,人们正在跳出OpenAI为行业“挖的坑”,开始正视这项技术所带来的真正价值。


01

 

越通用,越尴尬


以往,人们对通用大模型的观感是,它是一位良师益友,也无所不知。在产品角度,它被认为是一种认知型产品,用户体验体现在对话中给出的答案。


在过去,科学家们将主要精力放在了“如何将对话答案呈现地更聪明”。但实际上,却忽略了除认知功能外的绝大部分用户需求。


一位专注于营销获客的企业家对数科星球(ID:digital-planet)说:“我们需要更多的多模态数据以让用户画像更精确,但随着通用大模型参数量的增大,这种反馈结果反而越来越不精准。”


他不是唯一一个抱怨于此的从业者。更多人认为,在诸如LLaMA7B-65B的大模型中,参数量的提升对一些行业的帮助微乎其微。有一位出海领域从业者甚至认为“3B就够用了。”


对于垂直行业来说,增多的参数只是拓宽了大模型的知识面,但并没有落实到具体行业。换句话讲,大模型所增加的“智力”是千行百业中不需要的,客观上造成了供需不匹配的情况出现。


一位从业者表示,“它(指国外某大模型)以前是初中毕业水平,现在可能已经博士后了,可是我们行业其实高中毕业、大专生就可以了。”所以,在给定的计算预算下,垂直领域最好的性能不是由最大的模型实现的,反而可以通过在更多数据上训练的小模型实现。


以上,便是如今垂直模型能大型其道的根本原因。


02

 

“我想要的现在就要”


这些天,小模型和智能体(AI Agents)的火爆似乎印证了上述事实。即对行业从业者而言,开发出好用的行业工具的价值比一个看似“全知全能”的Copilot的价值多得多。

一位出海小模型从业者对数科星球(ID:digital-planet)称,他们的项目顺利拿到种子融资后,今年预计可以轻松实现2000万营收。就其项目本质,是利用开源模型和公开数据结合多模态构建出海营销工具。该项目可以绕开Temu、TikTok、亚马逊或Shopify等“媒介型”产品,通过EDM、即时通讯和电话/短信等方式触及东南亚的用户。

虽然,电话营销看起来又土又招人烦。但在ToB行业,在形形色色的获客手段都如过眼云烟后,证明了一个曾被反复证明的结论:最粗暴的做法往往是最有效的。

说回正题。最近一些天,我们看到的现实情况是,各行各业的从业者们正在展开对通用大模型的思辨,在现在,人们比以往任何时候都更希望简单直接、甚至直接创造营收。

一位服装行业从业者的回答更加直接了当:他既不看好智能助理也不看好国内大模型。其给出的解释是:“Copilot的故事被微软讲到头了,国内大模型之间的差距不大,现在开源数据集越来越多,国内相关产品的优势就更小了。”

在大模型打的头破血流之际,似乎,智能助理的市场空间只能寄希望于信创。

上述现实的市场情况导致几个结果:

其一,对于国内非通用大模型类厂商而言,选择做垂直则意味着跟国内无数个“作坊式”AIGC团队竞争,阳春白雪如何打败蚂蚁雄兵,前者的商业模式仍需推敲;

其二,由于不友好的GPU销售环境,越来越多的团队正在租用算力资源,用训练小模型的方式推出产品。对比国内厂商所提供的接口,很多企业更愿意用GitHub开源软件;

这样一来,曾经被行业看作“折中”路线的小模型,在性价比思维下“复活”了,并且呈现出愈演愈烈趋势。但反过来说,这似乎打了AGI一个耳光。

03

 

是模式还是收入


是模式还是收入,这是一个问题。

有人说,AIGC看似火爆、被投却很少,无疑是行业虚火、是美丽的泡沫;有人说,现在活下去才是王道、赚钱比什么都强,所以“野路子”频出、也有不少人闷声发大财。

客观而言,上述几种情况同时存在。究其原因:一方面,对于投资人而言,“不是名校、大厂、科班我不投”,这是一种信仰正确,短期难以改变;另一方面,普通的计算机人才常年供过于求、AI人才凤毛麟角,加之对GitHub的使用习惯,盲目跟风在所难免。

在数科星球(ID:digital-planet)所接触的诸多项目里,一些BP中的CTO甚至是大厂前端背景、资深数据库工程师,但我们又不能质疑这类团队的造血能力。

“当你以一种立场出发,其实便已经得到了答案。”一位投资人对我们说。硅谷的模式烧钱很多、本土的案例似乎也可以日进斗金,我们看到一个蓬勃而又扭曲的世界。“既然一线基金认为我们是三线项目,那么就让三线基金来投吧。”某项目创始人感慨的说。

是模式,还是收入?有人选择前者,有人更贴合实际。

在当下,“全知全能”的AGI似乎渐行渐远,如果垂直模型证明了自己,那么先前行业里岂不在为自己“挖坑”?

垂直和通用谁能笑道最后?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

垂类模型大有前景,但AGI却给自己“挖了个坑” 的相关文章

随机推荐

  • 17. 实战:手把手通关某音乐平台热门评论

    目录 前言 链接在评论区 目的 保姆级思路 最后奉上完整代码 运行效果 前言 众所周知 某音乐平台的评论区金句频出 热门评论更是美不胜收 我们也想要批量获取这些信息来做信息分析 数据处理等工作 也可以陶冶自己的情操 一举多得 所以我们今天来
  • 蓝以中老师《高等代数》第02章:向量空间与矩阵,笔记

    蓝以中高代第二章笔记
  • Android开源图表库MPAndroidChart

    MPAndroidChart是一款基于Android的开源图表库 MPAndroidChart不仅可以在Android设备上绘制各种统计图表 而且可以对图表进行拖动和缩放操作 应用起来非常灵活 和前面介绍的AChartEngine相比 MP
  • AutoSAR 学习笔记2:AutoSAR架构

    1 应用层 ASW 2 运行时环境层 RTE RTE 是专门为应用软件 AutoSAR 软件组件和 或 AutoSAR 传感器 执行器组件 提供通信服务的层 在 RTE 之上 软件架构风格从 分层 转变为 组件风格 AutoSAR 软件组件
  • 模板模式

    1 模板模式的概念 在模板模式 Template Pattern 中 一个抽象类公开定义了执行它的方法的方式 模板 它的子类可以按需要重写方法实现 但调用将以抽象类中定义的方式进行 这种类型的设计模式属于行为型模式 2 模板模式的特点 子类
  • 从煎鸡蛋的角度理解编程的思维和流程,你适合学吗?

    其实很多门外人对编程都是懵懵懂懂的 我们可以先看一张图来理解一下 思维 就是程序员需要考虑到的各种需求 也就是我们想让计算机帮助我们实现什么 表达 就是计算机可以看懂的指令也就是0和1 那怎么将我们所想向计算机说出来 并且让它帮我们执行 就
  • server2008r2域控时间设置internet时间同步(备忘)

    windows server 2008 r2成为域控后 时间设置里的 internet时间就没有了 为了解决这个问题 用以下CMD命令可解决 w32tm config manualpeerlist time windows com sync
  • iOS 应用获取最上层全屏 Window 的正确方法

    有时候 我们需要将View添加到最上层的Window上 比如 弹出框 Loading等 经常有同学直接通过 UIApplication sharedApplication windows lastObject 来获取 这种方法是非常不严谨的
  • leetcode----JavaScript 详情题解(4)

    目录 2722 根据 ID 合并两个数组 2723 添加两个 Promise 对象 2724 排序方式 2725 间隔取消 2726 使用方法链的计算器 2727 判断对象是否为空 2624 蜗牛排序 2694 事件发射器 2722 根据
  • 集成支付宝报错订单信息有错误,建议联系实家。 错误码: TOTAL FEE EXCEED

    问题 集成支付宝报错 订单信息有错误 建议联系实家 错误码 TOTAL FEE EXCEED 详细问题 笔者按照支付宝沙箱支付快速集成版进行操作 操作完成访问所集成的支付宝 页面如下 发起请求核心代码 response sendRedire
  • ubuntu(20.04)-shell脚本(4)-vmstat-iostat-expr-netstat-arp-Tracert-Route-NBTStat

    vmstat 好iostat 两个命令都适用于所有主要的类unix系统 linux的软件包 都在sysstat软件包中 1 vmstat iostat 基本语法 每列的意义 常用的 Free 空闲的内存空间 si 每秒从磁盘中交换进内存的数
  • 项目问题总结

    1 android studio 导入开源项目源码时要注意与自己包的冲突 比如 你有一个com xxxx的包 而需要导入的是com xx yy 你就不能把整个包复制过来 否则会报can t resolve symbil 因为它根据com会到
  • 虚幻4常见问题

    问题1 问题描述 UE4找不到游戏模块 UE4 the game module fps could not be found 解决方案 重新编译一遍C 项目 通过C 项目启动UE4生成游戏模块 为了防止生成失效可以启动uproject文件再
  • 数组是分配在栈中的

    关于JAVA堆 下面说法错误的是 正确答案 C 你的答案 B 错误 所有类的实例和数组都是在堆上分配内存的 堆内存由存活和死亡的对象 空闲碎片区组成 数组是分配在栈中的 对象所占的堆内存是由自动内存管理系统回收 JVM 关于堆和栈 Java
  • Java 数据转换/进制转换 工具类

    public class ByteUtil 十六进制转为十进制 public static String getHexToTen String hex return String valueOf Integer parseInt hex 1
  • Contact Form 7 获取用户IP和留言url,发布时间

    提交询盘时间 date time 客户访问IP a href remote ip a 点击打开可看到ip所属国家 客户访问产品 url 客户访问日期 date 客户访问者有没有facebook a href your email a
  • XXE(外部实体注入)

    写在前面 这个系列开始写写XXE相关的东西 这里是第一部分 相关资料及使用靶场如下 XML学习 靶场链接 XXE是以XML为基础进行的一种攻击 所以你需要先学习XML 为了更方便你检索题目且由于是国外网站 会带有一定外语及翻译 最后 如果你
  • 监听pda扫描_android系统PDA扫描枪,扫描完成后自带回车,为什么回车监听第一次不起作用,手动提交一次后才能正常提交...

    如题 第一次扫描后 在条码后出现的是回车 而不是绑定的提交按钮的提交功能 手动软键盘提交后 再回到扫描页 再次扫描 就会自动执行提交功能 下面附上源码 privateImageButton 如题 第一次扫描后 在条码后出现的是回车 而不是绑
  • openGL 调用glewInit()失败

    openGL系列文章目录 文章目录 openGL系列文章目录 前言 一 glew官网 二 glew库初始化调用失败 1 引入库 2 glew调用失败原因 着色器 运行结果 前言 OpenGL Extension Wrangler Libra
  • 垂类模型大有前景,但AGI却给自己“挖了个坑”

    巨量模型是个 坑 但垂直模型不是 数科星球原创 作者丨苑晶 编辑丨大兔 2023年4月 GPT 5的相关消息引起了一阵轰动 彼时 人们对巨量大模型既有期待 也有恐惧 更有甚者 认为人类历史或许将因此而画上终止符 但很快 从业者便发现 巨量大