GPT-4推理更像人了！中国科学院提出「思维传播」_欧洲杯app排行榜前十名(直播)欧洲杯竞猜app官网下载

发布时间：2024-06-23 03:23:41 来源：欧洲杯竞猜app官网下载作者：欧洲杯app排行榜前十名关注者：58人关注

GPT-4推理更像人了！中国科学院提出「思维传播」

　　大模型推理难题攻克了？中国科学院联手耶鲁大学的研究人员提出了全新框架「思维传播」，让大模型能够像人类一样类比思考。

　　对此，中国科学院和耶鲁大学的研究人员提出了一种「思维传播」（Thought Propagation）新框架，能够通过「类比思维」增强LLM的推理。

　　「思维传播」灵感来自人类认知，即当遇到一个新问题时，我们经常将其与我们已经解决的类似问题进行比较，以推导出策略。

　　可以预见的是，「思维传播」在为LLM逻辑能力的固有限制提出的全新思路，让大模型像人类一样用「类比」方法解决难题。

　　显而易见，LLM擅长根据提示进行基本推理，但在处理复杂的多步骤问题时仍有困难，比如优化、规划。

　　因为LLM的知识完全来自于训练数据中的模式，无法真正理解语言或概念。因此，作为统计模型，它们很难进行复杂的组合泛化。

　　再加上，大模型的推理是局部的、「短视的」，因此LLM很难找到最佳解决方案，也很难在长时间范围内保持推理的一致性。

　　人类从实践中积累了可重复使用的知识和直觉，有助于解决新问题。相比之下，LLM在处理每个问题时都是「从0开始」，不会借鉴先前的解决方案。

　　人类会监控自己的推理链，并在必要时修改最初的步骤。但是LLM在推理的早期阶段所犯的错误会被放大，因为它们会把后面的推理引向错误的道路。

　　在研究者看来，从0开始推理无法重复使用解决类似问题的见解，而且会在中间推理阶段出现错误累积。

　　下图是「思维传播」（TP）与其他代表性技术的比较，对于输入问题 p，IO、CoT和ToT会从头开始推理，才得出解决方案s。

　　1. 提出类似问题：LLM通过提示生成一组与输入问题有相似之处的类似问题。这将引导模型检索潜在的相关先前经验。

　　3. 汇总解决方案：有2种不同的途径——根据类比解决方案，直接推断出输入问题的新解决方案；通过比较输入问题的类比解决方案，推导出高级计划或策略。

　　这样一来，大模型就可以重用先前的经验和启发式方法，还可以将其初始推理与类比解决方案进行交叉检查，以完善这些解决方案。

　　- 最短路径推理：需要在图中找到节点之间的最佳路径需要全局规划和搜索。即使在简单的图上，标准技术也会失败。

　　- 创意写作：生成连贯、有创意的故事是一个开放式的挑战。当给出高层次的大纲提示时，LLM通常会失去一致性或逻辑性。

　　- LLM智能体规划：与文本环境交互的LLM智能体与长期战略方面举步维艰。它们的计划经常会出现「漂移」或陷入循环。

　　虽然（a）中的图非常简单，但由于推理从0开始，这些方法只能让LLM找到次优解（b,c），甚至重复访问中间节点（d）。

　　由于中间推理步骤的错误累积，ToT (b) 无法解决 (a) 中的问题。基于类似问题的解决方案，TP (c) 完善了最初的次优解决方案，并最终找到了最优解决方案。

　　通过与基线比较，TP在处理最短路径任务中的性能显著提升了12%，生成了最优和有效的最短路径。

　　在不同设置下，1层TP的token成本与ToT类似。但是，1层TP在寻找最优最短路径方面，已经取得了非常有竞争力的性能。

　　此外，与0层TP（IO）相比，1层TP的性能增益也非常显著。图5 (a) 显示了2层TP的token成本增加。

　　下表2显示了TP和基线中的表现。在一致性上，TP都超过了基线。另外，在用户研究中，TP在创意写作中人类偏好提高了13%。

　　在第三个任务评估中，研究人员使用ALFWorld游戏套件，在134个环境中实例化LLM智能体规划任务。

　　TP在LLM智能体规划中任务完成率提高15%。这表明，在完成类似任务时，对成功规划的反思TP具有优越性。

　　通过以上的实验结果表明，「思维传播」可以推广到各种不同的推理任务中，并在所有这些任务中表现出色。

　　类比思维是人类解决问题能力的标志，它可以带来一系列系统性的优势，比如更高效的搜索和错误纠正。

　　类似的，LLM也能通过提示类比思维，更好地克服自身弱点，如缺乏可重用的知识和级联的局部错误等。

　　高效地生成有用的类比问题并不容易，而且链式更长的类比推理路径可能会变得臃肿不堪。同时，控制和协调多步推理链也依旧十分困难。

　　随着进一步的发展，类比思维可能会使LLM的推理变得更加强大。而这也为在大语言模型中实现更像人类的推理指明了道路。

　　赫然是中国科学院自动化研究所模式识别国家实重点验室和中国科学院大学的教授， IAPR Fellow和IEEE高级会员。

　　此前，他在大连理工大学获得学士和硕士学位，并于2009年于中国科学院自动化研究所获得博士学位。

　　他的研究方向是生物识别算法（人脸识别与合成、虹膜识别、人物再识别）、表征学习（使用弱/自监督或迁移学习预训练网络）、生成学习（生成模型、图像生成、图像翻译）。

　　此前，他曾在腾讯人工智能实验室实习，并与Tingyang Xu博士、Yu Rong博士、Yatao Bian博士和Junzhou Huang教授共事。目前，他是耶鲁大学计算机科学系的交流生，师从Rex Ying教授。

　　他的目标是开发具有良好可解释性和可移植性的可信图学习（TwGL）方法，并探索其在生物化学方面的应用。

欧洲杯app