字节Seed都开始用化学思想搞大模型了——
深度推理是共价键、自我反思是氢键、自我探索是范德华力?!

传统的大模型长思维链推理基本把AI的思考过程等同于线性结构。
但很多情况下,后续的一个关键结论,可能需要回过头去验证早早提出的假设。
CoT把这种非线性的依赖关系忽略了。
字节Seed在论文《The Molecular Structure of Thought》中首次给大模型的长链思维定义了分子式结构。

在这种分子拓扑中,三种键是怎么相互配合的?
好的推理像分子结构
团队把DeepSeek-R1、gpt-OSS等强推理模型的长链思维拆成一步一步的,然后给每一步之间的“跳跃”打上标签。
打完标签发现,所有有效的长链思维里,其实就三种基础动作来回组合。
第一种叫深度推理,像共价键一样结实。
通俗来说就是类似“因为A所以B,因为B所以C”的硬逻辑推进。
团队在语义空间里做了一个很形象的量化分析,把模型的每一步思考都当成一个点,看这些点最后会散成多大一个圈。
圈子越小,说明模型越没跑题,思考越聚焦。
结果发现,加上深度推理之后,这个散点圈直接缩水22%。
深度推理确实起到了收束杂念、锁定核心逻辑的关键作用。
