00小说网 > 都市言情 > 高二分科,我选校花也选亿万身家 > 第660章 读不出的中国名字背后是他们读不懂的野心
最新网址:www.00shu.la
    2014年6月3日,清晨。

    ArXiv,全球最大的学术预印本平台。这东西对搞AI的研究者来说,就是学术圈的朋友圈。

    论文上传后二十四到四十八小时内全球可见,不用等同行评审,不用排队走期刊流程,直接面向全世界亮牌。

    每天早上起来第一件事,刷ArXiv。

    这是所有做深度学习的人的肌肉记忆。

    今天早上,这个朋友圈里炸了一颗雷。

    论文标题:Deep ReSidUal Learning fOr Image ReCOgnitiOn。

    作者:ShaOqing Ren, YUhang Zheng, LiqiU Chen。

    单位:JiUTian AI Lab, EChO TeChnOlOgy, China。

    斯坦福大学盖茨计算机科学大楼三层,博士后林之远端着咖啡走进办公区,习惯性刷新了CS.CV板块。

    他的手停住了,咖啡差点洒出来。

    152层卷积神经网络。ImageNet验证集TOp-5错误率,3.57%。

    人类标注员的平均水平是5.1%。去年ImageNet竞赛冠军GOOgLeNet是6.67%。这篇论文直接把数字按到了3.57%。

    “你们过来看看这个。”

    林之远的声音不大,但语调不对。

    旁边几个人抬起头,三分钟后,实验室十一个人全围在他屏幕前面。

    “等等,152层?”一个叫Kevin的白人博士生最先反应过来,

    “不可能。超过三十层的网络根本没法训练,梯度消失会把信号吃干净。这是常识。”

    “你往下看。”林之远指着论文第三页的示意图,

    “他们加了一个跳跃连接,把输入直接加到输出上。梯度可以跳过中间层回传。”

    Kevin盯着那张图看了十几秒。

    “这也太简单了吧。”

    “简单?”坐后面的赵明推了推眼镜,

    “最好的想法往往都简单。问题是你没想到。”

    Kevin的脸色不好看。

    实验室主任PrOfeSSOr WilliamS也走了过来。

    他花了五分钟把论文从头到尾扫了一遍,表情从惊讶慢慢变沉。

    “这个结果如果可以复现,整个领域的范式都要变。”

    他看了一眼作者单位。

    “JiUTian AI Lab。EChO TeChnOlOgy。这是什么单词?J-I-U-T-I-A-N,有人知道这是哪儿的吗?”

    没人回答。Kevin盯着那个拼音,舌头打着结尝试发音:

    “朱……田?或者……久提安?听起来像是个拼写错误。”

    “中国的。”林之远实在听不下去他那惨不忍睹的发音,冷声开口,

    “这是汉语拼音。JiUTian,对应的中文意思是‘九天’,指代极高的天空,或者是天的最高处。通讯地址标的四川。”

    安静了两秒。

    Kevin率先打破沉默:“四川?那是哪里?他们拿什么训练152层网络?这个规模的算力需求,谷歌大脑都得排队。一个中国民间实验室?”

    他顿了顿,耸了耸肩:“也许他们伪造了数据。”

    办公区气氛一下子变了。

    林之远转头看了Kevin一眼,没说话。

    赵明的手指在桌面上敲了两下,也没接话。

    WilliamS倒是很快开了口:

    “论文附了完整的训练日志和超参数配置,实验设计很规范。在没有复现之前,不要下结论。Kevin,你下午把18层和50层的对照实验搭起来,用我们的集群跑一遍。”

    Kevin张了张嘴,看了看WilliamS的表情,把话咽了回去。

    午饭时间,学术圈的邮件列表已经炸了。

    不只是斯坦福。伯克利、CMU、MIT、多伦多,所有做深度学习的组都在讨论这篇论文。

    谷歌大脑的Jeff Dean在内部邮件里转发了链接,批注只有一个词:“Read thiS。”

    脸书AI研究院的Yann LeCUn在推特上发了一条:“一篇有趣的论文,来自一个从未听说过的中国实验室。残差连接看起来很有前景。需要复现验证。”

    DeepMind伦敦总部的SlaCk频道里吵成了一锅粥。

    但所有的外国研究者都在问同一个问题:JiUTian AI Lab到底是个什么词?

    谷歌搜不到,领英搜不到,学术数据库里没有任何这个实验室的历史论文。

    第一作者ShaOqing Ren在微软亚洲研究院有过几篇论文,但那是一两年前的事了,之后这个人就从学术界蒸发了。

    一个没有任何学术积累的民间实验室,第一篇公开论文就丢出了这个量级的东西。

    要么是天才,要么是骗子。

    学术圈更愿意相信后者。

    但数据摆在那里。干干净净,清清楚楚。

    傍晚六点半,斯坦福校园的人流稀疏下来。

    林之远和赵明走出盖茨大楼,沿着棕榈大道慢慢走。暮色从太平洋方向涌过来,把路面染成橙红色。

    两个人都是中科大本科,赵明是02级少年班的,林之远大他一届。

    不过赵明本科毕业后就保送去了清华大学高等研究院,之后两人在斯坦福相遇,算得上是异国他乡的故交。

    在斯坦福读博期间互相照应了四年,博士后又在同一个实验室待了两年多。

    “你下午那句话说得够直接的。”林之远先开口。

    “Kevin那种人,你不怼他他蹬鼻子上脸。”赵明把双肩包的肩带往上提了提,

    “一个中国实验室发篇好论文,他第一反应是伪造数据。换成MIT出来的,他敢这么说?还有他念‘九天’那蹩脚的口音,听着都让人来气。”

    林之远冷嘲地扯了扯嘴角:

    “他们什么时候真正在意过我们的名字怎么念?咱们在这儿共事两年多了,组里的几个白人有谁能把‘ZhiyUan’发准音的?全是一口一个‘Z-yUan’。你的‘Ming ZhaO’,他们到现在还分不清哪个是姓哪个是名,上周教务处的邮件不还在叫你‘Mr. Ming’吗?”

    “骨子里的傲慢罢了。”赵明摇了摇头,语气里带着嘲弄,

    “他们只认得自己制定的规则,根本懒得花哪怕一分钟去了解我们的文化。所以这帮老外看着‘JiUTian’这个词,全都一头雾水。他们只认得拼音字母,但咱们华人一看这两个字,就知道背后是什么意思。九天,那是天之极。敢起这名字,绝对是憋着一股要把天给捅破的心气儿!”

    林之远目光动了动,没接这个话。两个人走了一段路。

    “我托国内的朋友查了。”赵明忽然放低声音,

    “回响科技,国内一家很大的互联网公司。做短视频、资讯、支付,体量很大。九天AI实验室是他们内部的研发机构,去年底才成立的。”

    “互联网公司搞AI实验室?”

    “对。据说他们在四川有一个规模很大的GPU集群。”

    林之远愣了愣。“你到底想说什么?”

    赵明停下脚步。

    “之远,你在这边待了多少年了?”

    “算上读博,快七年。”

    “我八年。”赵明说,“八年了,你觉得他们真把咱们当自己人了吗?”

    林之远沉默。

    “我去年申教职,六个学校全拒了。论文比同期的人多一倍,引用数高三倍,简历白纸黑字摆在那儿,连面试机会都没有。招聘委员会跟我说‘你的研究方向和我们不太匹配’。四个学校,四个一模一样的理由。”

    赵明的声音很平,但林之远听得出底下压着什么。

    “你还记得朱传榘吗?四十年代参与ENIAC研发的核心工程师,设计了二进制逻辑电路。结果ENIAC公开的时候,四个署名全是白人,他直接被除名。三十五年后才拿了个安慰性质的先驱奖。”

    “还有六十年代研发分组交换网络的黄有光,提出互联网底层的存储转发机制,成果直接被白人同事挪用署名;发明FinFET技术给摩尔定律续了二十年命的胡正明,凭一己之力撑起了全球数十亿的手机电脑芯片,但在主流媒体的科技史里却几乎查无此人。”

    林之远走到路边一张长椅前坐下来。

    “你说这些我都知道。”

    “知道是一回事,做决定是另一回事。”赵明在他旁边坐下,“我前段时间给导师打过电话。”

    “杨先生?”

    赵明点头。他本科在中科大读物理,毕业后保送去了清华大学高等研究院,在杨先生门下研究过一段时间量子信息,再后来出国深造才转行搞了AI。

    虽然跨了界,但他跟导师一直保持着联系,导师也很支持他的跨界。

    老先生一直在清华任教,如今虽然年过九旬,思维依然清楚,对国内学术动态的关注比很多在职教授还勤。

    “杨先生说,国内现在条件和以前不一样了。算力、资金、政策支持都上来了。有些研究完全可以回去做。”

    赵明顿了顿,

    “他原话是:‘你们这代人比我那代幸运,你们有选择的权利。但选择本身就是一种责任。’”

    棕榈大道上的路灯亮了。

    林之远望着远处胡佛塔的轮廓,半天没出声。

    他想起了很多事。

    想起第一年来的时候,房东听到口音多收了两百刀押金。

    他想起组会上他的方案被Kevin一句“intereSting bUt nOt praCtiCal”轻飘飘地打发掉。

    想起去年圣诞派对,一个喝醉了的教授拍着他肩膀说“你们中国人真勤奋”,语气里那种居高临下,藏都藏不住。

    他又想起了合肥。想起中科大东区的梧桐树,想起毕业那天师兄说的话:出去看看世界,但别忘了你是谁。

    “好。”林之远说。

    赵明看他一眼:“好什么?”

    “回去。我跟你一起回去。”

    两个人在长椅上坐了很久,天色彻底暗下来,路灯把两道影子拉得很长。

    同一天。

    英国剑桥,DeepMind的一间会议室里,三个研究员围着投影幕布逐页翻阅补充材料,讨论持续到了凌晨一点。

    加拿大蒙特利尔,YOShUa BengiO的博士生在读书会上把这篇论文列为本周必读,PPT做了四十页。

    日本东京,一个专攻图像识别的研究小组已经在服务器上搭建复现实验,组长在白板上写下了“残差连接”,画了个圈。

    韩国首尔,KAIST的几个博士生在实验室群聊里争论不休,有人已经在给论文作者发邮件,询问预训练模型是否会开源。

    以及大洋两岸各大高校里,不计其数的华人研究者在看到作者名字和单位之后,做了同一个动作。

    他们打开浏览器,敲下那串让外国同行摸不着头脑、却能让同胞瞬间血脉贲张的拼音,搜索了“JiUTian AI Lab”。
最新网址:www.00shu.la