深度

2023-11-15

深度 | 谷歌新人李飞飞:击碎玻璃天花板的华裔女科学家

机器之心原创

作者:机器之心编辑部

本周二,谷歌宣布斯坦福大学教授李飞飞加入其云团队。作为第一代中国移民,这位图像识别领域的杰出学者是如何从普林斯顿进入斯坦福,最后成为谷歌人工智能团队新任领导者的?让我们来了解一下这名华裔学者的传奇经历吧。

实现美国梦

  

1976 年,李飞飞出生于北京,后来在四川长大

如果你真想做一件事,全世界都会来帮你。16 岁刚来美国的那两年,李飞飞却只能从依靠自己开始。在帕西悉尼的白人圈子中,这位亚裔姑娘显得有点孤独,她像所有极客一样过着简单的生活。那个时候打工与学习几乎占据了她所有的时间。李飞飞明白,这就是普通新移民的生活,需要点牺牲和决心。幸运的是她的同学和高中数学老师在这时给了她莫大鼓励和帮助。

1995 年,李飞飞进入普林斯顿大学攻读物理学,生活的大门终于渐渐为她打开。在周一到周五,她是普林斯顿物理系拿着高额奖学金的高材生,周末则必须回到 Parsippany 的洗衣房,置身于成堆的衣服中。她说「我爱普林斯顿。」因为这里有全世界最优秀的年轻天才。

然而生活的艰辛也在随着年龄增长,她见过斯坦福的优秀博士毕业生为一张绿卡四处奔波,那时的她不明白也无法想象一张绿卡,一个留在美国的机会能难倒全世界那么多优秀的人才。

有过移民经历的人对平等有着更加深刻的体会,李飞飞也如此,她坚持主张高科技产业性别平等,支持种族多样化,还有反对特朗普。她曾在 Twitter 上调侃特朗普是个不懂科学没有眼界的人。

李飞飞说:「多样化的危机,也正是我们的社会正在应对的危机。『科技是没有灵魂的吗?』」她坦承自己对 AI 研究界的失望,因为这一领域不太欢迎不具代表性的少数群体。在她工作的部门里一共有 15 名全职人员,她是唯一的女性。

梦想与责任

并不是每个美国移民都能实现自己的梦想,但李飞飞做到了。当初她随父母举家搬到大洋彼岸。「他们来到这个国家是为了追求梦想。」李飞飞认为她也「应该能够追求自己的梦想。」这个「应该与能够」的选择做起来并不轻松。

1999 年,李飞飞从普林斯顿大学毕业,那时的华尔街一片辉煌,互联网泡沫的热潮接近顶峰,李飞飞接到了多家金融公司的工作邀请。然而她却没有从中选择任何一份工作来减轻家庭经济负担。她的父母支持她做出了最后选择,去西藏研究藏医。

虽然李飞飞知道自己终将回到学校,回到科研工作中来,读博士也是她的梦想,但西藏之行并非人生插曲。

在科学界藏医与中医一样存在很多争议,但这并不妨碍李飞飞对它的兴趣。她在媒体采访中提到,作为一个科学家,藏医可以在哲学和方法论层面上给她给多的理解。她非常看重具体科研项目在更大领域范围内的意义,每一项研究开始之前都要经过深思熟虑。

  

她曾经放弃高盛的 offer,追随梦想来到西藏

在李飞飞后来写给博士生们的信中可以看到她对科学探索的态度:

每个领域的每一篇论文都应该以独特的新视角进行研究。所以当你在机械地开展你们的工作前,请扪心自问——『我的研究会重新定义这一领域的未来吗?』这意味着发表论文的意义不是『这个方向没有人写过』,或者『让我来解决这个小问题,它的成果会很容易展示』;研究意味着『如果我做了,这一重大问题就有了更好的解决方案』,『如果我做了,我就真正开拓了这一领域』。你的研究成果应该能被很多人和行业直接使用,换句话说,你的选题应该有很多『客户』,你的解决方案应该是他们想要的。

西藏归来之后,李飞飞开始了加州理工的博士学业。博士期间母亲接连患上了癌症与中风,那是一段艰苦的日子,李飞飞说,「我们经历了很多困难,然后一起挺过来了。既要担起生活的责任,又要对得起自己的梦想」。

改变图像识别方向的人

是什么吸引谷歌一次性将李飞飞和她的门生李佳一齐请进公司,并委以重任的?显然是她的学术成就和影响力。

自 2009 年以来,李飞飞一直担任斯坦福人工智能实验室和斯坦福视觉实验室的负责人,并成为了终身副教授。在她 2014 年的简历上,有 95 篇在 Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS 等顶级期刊与会议上发表的文章;联合发表的文章有 32 篇。从 2015 年到 2016 年,李飞飞署名发表的论文有 33 篇(斯坦福视觉实验室),还有一篇将在 2017 年发表在 CSCW 会议上。

在不就之前,艾伦人工智能研究所推出了以人工智能为基础的免费学术搜索引擎Semantic Scholar。我们使用该引擎生成了李飞飞的论文引用量图解(注:搜索时请注意名字输入格式,Feifei Li 为另一位作者。),如下:

  

  

过去 3 年,李飞飞论文的平均引用量为 6738。

  

基于可用数据,Semantic Scholar 估计李飞飞的引用量在 33215 到 44773 之间。

回溯过去,李飞飞在计算机视觉上的研究已经花费了 15 年。

在 2007 年,李飞飞和一位同事着手开始一项庞大的任务,为来自互联网的十亿张图片进行分类、打标签,从而为计算机提供样本。其中理论基础是如果机器观察到足够的事物,它们就能够在现实世界进行识别。

他们使用亚马逊 Mechanical Turk 这样的众包平台,邀请了来自 167 个国家的 5 万人帮助为其中的数百万张图像打标签。

最终,他们建立了 ImageNet 数据集。今天,这个数据集包含了使用日常英语标记的超过 1400 万张图像,跨越 21,800 个类别。

在我们用 Semantic Scholar 生成的图解中发现,李飞飞被引用最多的论文就是她于 2009 年在 CVPR 上发表的《ImageNet: A large-scale hierarchical image database》。

  

李飞飞Ted演讲

瓜分学界人才的科技巨头们

谷歌的云业务负责人 Diane Greene 在新闻发布会上说,李飞飞和李佳的加入是谷歌正式将人工智能集团业务正式化的一部分。此后,该团队不会只专注于人工智能研究,而是致力于将尖端技术融入各种 Google Cloud 产品,例如让公司预测销售情况的软件。

而在宣布成立人工智能集团之前,谷歌还围绕着云服务部门产品路线图发布了一系列产品,介绍了他们如何扩大机器学习的使用。对于云计算来说,机器学习是一项关键的技术,它能训练大规模的 AI 网络,不断自我学习和提升。

Google Cloud 及其机器学习团队的产品经理 Rob Craft 也表示,这两名研究者将帮助谷歌「将机器学习的力量带入其他行业」,他们也将成为谷歌整合其研究单位及核心业务努力的一部分。

但是,雇用具有机器学习和相关任务专业知识的人才并不便宜。这一行业内的激烈竞争导致谷歌这样的大公司经常会支付「NFL 球员签字费」级别的巨额资金,而越来越多的顶级学界研究人员也陆续加入了大公司的怀抱。

近年来,学界内重所周知的大牛们基本被科技巨头筛了个遍,方式也是各种各样。

最初,谷歌先是收购了多伦多大学的一家初创公司 DNNResearch。但实际上,这家公司只有三个成员,Geoffrey Hinton 和他的两个刚毕业的、曾经赢得 2012 年的 ImageNet 大赛的学生——Alex Krizhevsky 和 Ilya Sutskever(现在加入了 OpenAI)。

如今被称为谷歌最成功一笔收购的 DeepMind 也是竭尽全力的在挖空英国的人工智能人才。前几日 Business Insider 的一篇文章指出,牛津大学与剑桥大学最优秀的人工智能人才一直在被科技巨头收拢。

而且在文章中重点提到,虽然微软和 Facebook 这样的美国科技巨头也正在招募牛津大学的研究生和教授,但是 DeepMind 似乎比其他的公司挖到的人才更多。DeepMind 从被谷歌收购了之后就已经把它的团队规模从在国王十字路时的 100 人扩大到了大约 250 人。

不只是谷歌,以美国、中国为主力的科技巨头们正如同「风暴之眼」一般吸纳着一切尽可能的能量推动着公司在人工智能道路上的快速发展。

微软在人工智能研究中一直处于第一梯队,在 9 月底宣布组建 5000 人规模的专注人工智能的工程和研发团队 Microsoft AI and Research Group。

之前我们觉得已然落后了的苹果,在 10 月份拉拢到了 CMU 机器学习教授 Russ Salakhutdinov作为该公司人工智能研究的负责人,开始招聘人才、组建团队。

中国的 BAT 三巨头。百度因为有吴恩达,「声音」是最大的,我们对他们的人工智能研究也是了解最多的(开源深度学习框架 Paddle、硬件基准测算工具 DeepBench 等)。

阿里在今年的云栖大会上也「秀」了一把人工智能。

腾讯也在最近成立了腾讯 AI Lab,新一轮的招兵买马不可避免。虽然在机器之心的专访中他们对腾讯 AI Lab 没谈到太多内容,但隐隐可察觉出腾讯也要像谷歌一样在人工智能与自己的平台和产品结合上打通一条道路。

在接近尾声的 2016 年,我们已经明显感觉到人工智能、机器学习、深度学习等字眼成为了科技界的主流。从害怕 AlphaGo 之后因过度炒作而经历新一轮寒冬,到语音识别、神经机器翻译等的一个又一个的技术突破,再到越来越激烈的人才竞争,一个新的时代即将到来。

©本文由机器之心原创,转载请联系本公众号获得授权

  ?------------------------------------------------

加入机器之心(全职记者/实习生):hr@almosthuman.cn

投稿或寻求报道:editor@almosthuman.cn

广告&商务合作:bd@almosthuman.cn

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度 的相关文章

  • Java代码连接数据库

    一 JDBC 全称 Java database connectivity java连接数据库 使用 Java 代码去连接数据库 然后对数据库中的数据进行增删改查 加载驱动 首先导入mysql的jar包 1 在 src 文件夹下面新建一个 l
  • 最长上升子序列(C语言 动态规划)

    描述 一个数的序列bi 当b1 lt b2 lt lt bS的时候 我们称这个序列是上升的 对于给定的一个序列 a1 a2 aN 我们可以得到一些上升的子序列 ai1 ai2 aiK 这里1 i1 lt i2 lt lt iK N 比如 对
  • linux设备利用率,linux – 对dm设备100%利用率的影响

    我们这里有一台RHEL 5 6服务器 有4条到单个LUN的活动路径 我们怀疑它无法将管道中的足够的IO塞进到另一端的XIV mpath0 XXXXXXXXXXXXXXX dm 9 IBM 2810XIV size 1 6T features
  • WARN Received a PartitionLeaderEpoch assignment for an epoch < latestEpoch

    Topic 处于 under replicated 状态 server log 充满 2020 11 30 19 00 00 006 WARN Received a PartitionLeaderEpoch assignment for a
  • MySQL---创建表和连表、分组、排序等操作

    首先这里有两张表做测试用 代码均在命令提示符终端完成 创建部门表 create table department table department id int auto increment primary key department v
  • TCP三次握手如果使用二次握手代替则会出现的问题

    简述 第一次握手 发送SYN报文 传达信息 你好 我想建立连接 第二次握手 回传SYN ACK报文 传达信息 好的 可以建立链接 第三次握手 回传ACK报文 传到信息 好的 我知道了 那我们连接 然后就建立连接了 在发送报文之前各方都要确认
  • Java基础——Math类、Random类、System类

    目录 1 Math类 2 Random类 3 System类 1 Math类 Math 类包含用于执行基本数学运算的方法 如初等指数 对数 平方根和三角函数 成员变量 public static final double E 自然底数 pu
  • java设计模式——代理模式(Proxy Pattern)

    概述 在某些情况下 一个客户不想或者不能直接引用一个对 象 此时可以通过一个称之为 代理 的第三者来实现 间接引用 代理对象可以在客户端和目标对象之间起到 中介的作用 并且可以通过代理对象去掉客户不能看到 的内容和服务或者添加客户需要的额外
  • 在vscode中创建vue自定义模板

    首先找到用户代码片段的位置 https img blog csdnimg cn 20201105094443610 png pic center 在输入框中输入vue 然后选择vue json或vue 打开之后是这样的 这些注释就是介绍怎么
  • SQL拼接存在的误区

    这两天修复一个SQL拼接的问题 给自己挖了个坑 对于指定的字符串作为查询条件时 当在SQL语句中使用单引号包裹查询条件时 需要注意以下几点 1 SQL注入攻击 如果接受外部输入的值直接拼接到SQL语句中 在查询条件中包含特殊字符如单引号或双
  • Java内部类总结

    Java内部类其实在J2EE编程中使用较少 不过在窗口应用编程中特别常见 主要用来事件的处理 其实 做非GUI编程 内部类完全可以不用 内部类的声明 访问控制等于外部类有所不同 要灵活使用内部类来编写程序 还是有相当难度的 Java发明了这
  • Web后台快速开发框架

    Web后台快速开发框架 Coldairarrow 目录 目录 第1章 目录 1 第2章 简介 3 第3章 基础准备 4 3 1 开发环境要求 4 3 2 基础数据库构建 4 3 3 运行 5 第4章 详细教程 6 4 1 代码架构 6 4
  • PC: 市场寒冬剖析

    市场调研机构Canalys数据显示 今年一季度 中国市场整体PC出货量同比下降24 至890万台 已是连续第五个季度下跌 今年截至618结束 都没有一家主要的PC厂商愿意发战报 PC市场怎样走出寒冬 谈谈你的理解和看法 PC 一 2022年
  • Rxjava学习(一)简单分析Rxjava调用流程

    本篇以Rxjava最简短的调用流程为例来分析 下面是要分析的实例代码 Observable create new ObservableOnSubscribe
  • 1140 石子游戏 II

    题目描述 亚历克斯和李继续他们的石子游戏 许多堆石子 排成一行 每堆都有正整数颗石子 piles i 游戏以谁手中的石子最多来决出胜负 亚历克斯和李轮流进行 亚历克斯先开始 最初 M 1 在每个玩家的回合中 该玩家可以拿走剩下的 前 X 堆
  • C++中传送函数指针

    随时随地阅读更多技术实战干货 获取项目源码 学习资料 请关注源代码社区公众号 ydmsq666 函数指针是一种非常好的类型 因此 可以编写一个函数 它的一个参数是函数指针 然后 在 外部 函数使用其函数指针参数时 就间接地调用在调用函数时对
  • vue路由

    路由 理解 一个路由 route 就是一组映射关系 key value 多个路由需要路由器 router 进行管理 前端路由 key是路径 value是组件 路由标签

随机推荐