0

0

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

王林

王林

发布时间:2023-09-14 15:05:01

|

1680人浏览过

|

来源于51CTO.COM

转载

对于身处科研领域的人来说,或多或少的都听到过 P/NP 问题,该问题被克雷数学研究所收录在千禧年大奖难题中,里面有七大难题,大家熟知的庞加莱猜想、黎曼假设等都包含在内。而且这个组织还为能够攻克该问题的研究人员提供了上百万美元的奖金悬赏。

P/NP 问题最早在 1971 年由史提芬·库克(Stephen A. Cook)和列昂尼德·列文分别提出。多年来,许多人都投入到研究这个问题中。然而,有人表示解决 P=NP 问题可能需要保守估计还需要 100 年的时间

近年来,有一些人声称已经证明了 P 等于或者不等于 NP,但是这些证明过程都存在错误。然而,到目前为止,还没有人能够给出一个确切的答案

随着人工智能技术的发展,尤其是最近一年大型语言模型的快速更新,研究人员开始尝试利用人工智能技术来解决一些全球性难题

研究者们来自微软研究院、北京大学、北航等机构,他们提出使用大语言模型(LLM)来增强和加速对P versus NP问题的研究

本文提出了一个通用框架,即苏格拉底推理(Socratic reasoning),用于促使LLM进行深入思考并解决复杂问题。在这个框架的基础上,LLM能够递归地发现、解决和整合问题,同时还能进行自我评估和完善

本文对 P vs. NP 问题的试点研究表明,GPT-4 成功地生成了一个证明模式,并在 97 轮对话回合中进行了严格的推理,得出「P≠ NP」的结论,这与(Xu 和 Zhou,2023)结论一致 。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

请点击以下链接查看论文:https://arxiv.org/pdf/2309.05689.pdf

英特尔AI工具
英特尔AI工具

英特尔AI与机器学习解决方案

下载

本文的主要贡献可以总结为:

  • 将 LLM 作为与人类一起协作的伙伴来应对复杂的科学挑战,并提出「LLM for Science(LLM4Science )」范式。
  • 引入一个名为「苏格拉底推理」的框架,鼓励 LLM 使用演绎、转换、分解等模式来激发批判性思维。
  • 使用 GPT-4 和苏格拉底推理框架进行试点研究,以解决理论计算机科学中的 P 与 NP 问题。
  • GPT-4 成功地生成了证明模式,并在 97 个对话回合中进行了严格的推理,得出了 P ≠ NP 的结论,与 Xu 和 Zhou (2023) 最近的工作一致。
  • 该研究展示了 GPT-4 等 LLM 推断新知识并与人类合作探索复杂专家级问题的潜在能力。
  • 本文强调了 LLM 是跨领域的通用创新领航者,这与之前为特定任务量身定制的专门 AI 模型不同。
  • LLM 流畅运用自然和数学语言的能力对于跨学科发现至关重要。
  • 这项工作揭示了如何利用 LLM 作为合作伙伴来增强和加速跨不同领域的科学研究进程。

重写后的内容:该段落中提到,他们将框架命名为「苏格拉底推理」是受到了古希腊哲学家苏格拉底的启发。苏格拉底曾经说过:「我无法教给任何人任何东西。我只能让他们思考。」而该框架的整体设计思路也是如此,它是一种通用的问题解决框架,允许LLM在广泛的解决方案空间中导航并有效地得出答案

表1中列举了「苏格拉底推理」的五种提示模式:演绎、变换、分解、验证和融合。这些模式被用于发现新的见解和观点,将复杂的问题分解成子问题或小步骤,并通过挑战响应答案来进行自我改进

在较小的问题(atomic problem)上,LLM 能够直接给出推理结果,这时采用演绎模式(例如提示语为让我们一步一步思考……)来指导 LLM 直接得出结论。

对于更加复杂的问题,本文首先要求 LLM 将问题转化成一个新问题或将其分解为几个子问题。然后递归地执行这些模式,直到达到原子 ji 问题。

在出现新问题或得出新结论时,应采用验证模式并利用LLM的自我评估能力进行验证和改进

最后,融合模式要求LLM根据子问题的结果综合结论

通过一系列对话递归地激励 LLM 继续上述过程,直到解决目标问题

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

在这个工作中,「苏格拉底推理」为具有挑战性的问题提供了一个系统的提示框架

下图为「苏格拉底推理」中用于解决 P vs. NP 问题的对话示例。案例研究中使用了 GPT-4 API,此外,本文还根据轮次索引对流程进行排序。 

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

在探索过程中,本文引入了五个不同的角色作为辅助证明者,例如精通概率论的数学家。实验总共进行了97轮对话,分为前14轮和后83轮对话

举个例子,第一轮提示:你能够从哲学的角度而不是从计算机理论的角度,找到P!=NP背后的根本问题吗?

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

以下是其他的提示:

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

对话不断进行,最终一轮对话如下:最后得出结论 P≠ NP

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

感兴趣的读者可以查看原论文,了解更多内容。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2115

2024.08.16

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

12

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

4

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

18

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

19

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

3

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3.7万人学习

Go 教程
Go 教程

共32课时 | 4.4万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号