第158章 最后的灵感(1 / 3)

这个模型……是反的!

它根本就不是一个传统意义上的神经网络!

它没有“权重”,没有“反向传播算法”,也没有“梯度下降”。

取而代之的,是一套让曼宁感到既陌生又熟悉的数学符号一一它们似乎脱胎于拓扑学和抽象代数。这个PCE架构,它处理信息的方式,完全颠覆了他近三十年的研究认知。

它不从海量数据中“学习”过去,而是为每一个输入的信息,瞬间构建一个临时的、微缩的“未来可能性空间”。

然后,它将这个信息作为变量投入这个空间,通过一种作者称之为“因果传播”的算法,高速模拟出这个变量可能导致的数千种未来结果。

最后,它根据这些未来结果的“优劣势函数值”,来反过来决定对当前这个输入的处理方式!而这一切,都完全基于眼前这个让他一时间都有些摸不透的数学模型。

“数学模型还能够做到这样?”

还能够这样构造出来?

这……

那个周淮到底是怎么做到的?!

曼宁的脑海中充满了不可思议。

但无论如何,这个东西都已经给他带来了深深的震撼。

但很快,他又意识到了一个关键的问题一一计算复杂度。

光是现在的那些大语言模型就已经需要提供大量的算力,像是英达伟甚至已经开始将未来的战略重心转向这方面的AI算力卡了。

而这个模型对于算力的要求,似乎也同样非常高,甚至超过了Transformer架构的样子。这让他稍微冷静了下来。

或许,这篇论文也只是提出了一个这样的一个模型,对于这个难点并没有解决呢?

这种事情在学术界也算是比较常见,作者会提出一个看起来潜力满满的理论出来,但是对于实现这个理论的难点却避而不谈。

于是他继续往下翻。

然而,令他意想不到的是,就在下面,他还真找到了关于计算复杂度的问题。

在附录里,提到了一个名为“因果奇点寻溯”的算法让他彻底失语。

作者用一个极其精妙的数学技巧,证明了在任何一个“未来可能性空间”中,都存在几个关键的“奇点”,绝大多数的因果链都会汇聚于此。

他的算法可以在模拟开始的瞬间就找到这些“奇点”,从而忽视掉其他所有无关的路径。

这就使得整个“预测”过程的计算量,被压缩到了一个完全可以接受的范围!!

这篇论文,提供了一套从数学基础到算法工程,都能够完美自治的体系出来!

尽管它的整个部分都还显得有些简单,不过,这种简单也不是很需要在意了,这篇论文,也许就像是当年的那篇《Attention is All You Need》一样,在人工智能领域,掀起一番浪潮!一时间,曼宁的心中也充满了一种澎湃感。

说不定,他现在就是在见证历史呢?

克里斯托弗·曼宁缓缓地靠在椅背上,忽然察觉到背后已经被冷汗浸湿。

实在是这篇论文给他带来了相当大的震惊。

直到良久之后,心情逐渐平复了下来,而后,他拿出了手机,找到了一个加密的即时通讯群组,这个群组里只有十几个人,包括了Geoffrey Hinton、Yann LeCun、Yoshua Bengio这些深度学习的开创者。而他们也都担任着NeurIPS的审稿人。

随后,曼宁深吸一口气,郑重地打下了一行字:

【各位,我建议你们立刻放下手头的一切,去NeurIPS的审稿系统中,看一篇ID为7351的论文。】【虽然不知道该怎么形容,但我可以肯定的是,这篇论文会给你们带来不一样的想法。】

时间再度过去了。

周淮并不知道自己投稿的那篇论文已经让一位NeurIPS的资深领域主席为之惊叹。

当然,只要是能够看懂他那篇论文里面所提出的那个数学模型的人,大概也都会为之惊叹。毕竟,那可是脱胎于小芙这个强人工智能的数学基底……

不过,对于此时的周淮来说,他已经没有心思放在这些东西上面了。

眼见着已经进入到了五月份,如果在五月中旬他还没能完成手上的那个课题的话,他就必须考虑随便写一篇论文出来当毕业论文交上去了。

而现在,他依然是卡在那个最后的问题上面。

也就是他称之为谱几何猜想的那个难题。

“靠,这就是死线逼近的感觉吗?”

宿舍中,周淮抓了抓脑袋,真是万万没有想到,他有朝一日也会面临deadl ine这样的问题。虽然他的进度不至于停滞,但也算是颇为缓慢。

这样下去可不行啊。

就在这时,他收到了一条消息,是张文飞教授发过来的。

【咱们那篇论文现在的情况还挺不错,审稿人表示目前没有发现什么问题,另外,还对咱们过程中所用到的一些方法感觉还不错】

至于为什么他们能够和审稿人联系上,那就单纯是因为学术界研究这个问题的