王浩感觉自己的喉咙有些发干。
他作为一名挣扎在科研一线的博士生,太清楚一篇NeurIPS论文背后需要付出多少心血了,那意味着一个新颖的idea,严谨的数学证明,海量的编程实现,繁琐的实验调试,以及最后的论文写作和修改。这通常是一个团队协同工作数月甚至一年的成果,而一个团队也往往都是一个教授,几名博士后,以及几名博士生硕士生共同努力的成果。
而一篇Oral,其工作的深度和完整度更是远超普通论文。
结果现在,眼前的这个事实告诉他,一个人,就完成了这一切?
他感觉自己的世界观都受到了冲击。
当然,不仅仅是他,旁边的其他人也都同样的震惊。
翻一翻其他的Oral论文,哪个不是靠着团队合作才完成的?
而且所属的单位也基本上都是名校,或者是顶尖机构,要么就是大公司,比如说歌谷、巨硬等等,国内也是企鹅、阿狸之类的。
哪怕是有人想要蹭进这样的课题组都没那么简单,要么出钱,要么出力,沾亲带故的那种都属于比较少的情况了。
但是现在,硬是有这样一个人完全无视了这种种困难,只靠一人就脱颖而出,更是排在了1901篇论文中的第五名。
“奇迹。”
最终,朱俊只能用这样一个词语来形容了。
与此同时,全世界正在看着NeurIPS接收论文榜单的人们,也有相当多人发现了这个作者仅有一人的论文。
这个时间点本就是热度最高的时候,多的是人一时间睡不着觉,到处在网上搜索各种相关的消息,于是乎,关于这篇作者只有一个人,而且审稿人得分还排在第五名的论文,立马就成为了不少人讨论的热点。“一篇来自非AI专业的新人论文,直接拿了Oral?”
歌谷DeepMind,一名员工惊呼出声,引起了周围其他同事们的关注。
“大卫,你也发现了那篇论文?”
旁边的罗伯特问道。
“是啊!我看现在有好多人都在讨论那篇论文,还有好多人也说从来没有在咱们计算机界见过这个名字一反正我确实从来没有见过。”
那名叫大卫的员工点点头说道,“这得是多强的质量才能够让审稿人们给出了这么高的分数!”“那就看一看吧,我也很好奇这篇论文的质量到底有多高,这个标题看起来就足够唬人了,前瞻性因果推演的计算架构,它是要挑战Transformer吗?”
两人说着,旁边也有其他人走了过来,准备和他们一起看这篇论文,这间办公室中不敢说每个人都尝试过给NeurIPS投稿,但是也能说百分之七八十以上的人都参与过相关的项目。
毕竟根据统计,歌谷公司就足有169篇论文被接收,是论文被接收数量最高的机构,比起排名第二的斯坦福大学的104篇还要高上的65篇。
所以,他们之中有不少人刚才搜索相关新闻的时候都了解到了这个消息。
随后,他们便从官网下载了这篇论文,开始看了起来。
打开PDF文档,论文的排版简洁、规范,是标准的LaTeX风格,无可挑剔。
“摘要写得很大胆,但也很清晰。”罗伯特简单地点评道,他主攻的方向是大语言模型,“这个作者说提出了一种新的计算模型,旨在解决上下文理解和优先级判断的难题……这几乎是所有AI研究的圣杯了。”大卫点点头,向下滚动页面,目光扫过引言部分,通常,引言会大量引用前人的工作,以证明作者对领域的了解。
但这篇论文的引言……引用量少得惊人。
“奇怪,”大卫皱起了眉头,“他只引用了几篇最基础的关于RNN和Transformer的论文,然后就开始……进行逻辑推演?”
罗伯特也发现了这一点,他的表情变得严肃起来,“他不是在综述文献,他是在……批判。他在用数学论证了为什么基于统计关联的架构,在本质上就无法避免“事实幻觉’,天哪,他把这个问题归结为了一个“概率路径依赖’的数学缺陷。”
办公室里更安静了,所有人都明白这意味着什么。
“这人对自己的数学这样有自信吗?”大卫看着上面那关于数学推论的部分。
这部分写的很简洁,然而……对于数学知识的考验却异常艰深。
哪怕是他一时间也看了一会儿才算是明白了这个如此简单的数学式子中凝练何等关键的信息。他咽了咽口水,然后继续操作鼠标,将页面滚动到了论文的核心部分一一第三章:前瞻性因果推演架构(The PCE Architecture)。
当那一套完全不同于神经网络的数学模型和结构图展现在他们眼前时,整个办公室里响起了一片倒吸凉气的声音。
“这……这是什么?”旁边,一个稍微年轻一点的工程师疑惑地说道,“没有反向传播?没有梯度下降?这些东西……看起来更像是拓扑学里的东西吧。”
“是拓扑学吗?嗯……好像确实是拓扑学的样子啊。”
“但似乎也不完全是拓扑学?