LLM的三大缺陷，你知道几个？

PHPz

发布时间：2023-11-26 11:26:40

1642人浏览过

来源于51CTO.COM

转载

科学：远非是一种永远仁慈有益的实体，未来的感知通用AI很可能是一个操纵性反社会个体，它会吞噬你所有个人数据，然后在最需要它的时候就崩溃。

译自3 ways llms can let you down，作者 joab jackson。

OpenAI 即将发布 GPT-5，外界对它寄予厚望，最乐观的预测甚至认为它将实现通用人工智能。但与此同时，CEO Sam Altman和他的团队在将其推向市场过程中面临许多严峻的障碍，他本月早些时候就已经承认了这一点。

有一些最近发表的研究论文可能提供了对于Altman挑战的线索。这些论文总结了OpenAI开发的GPT和大型语言模型的各种缺点

综上所述，这些论文指出，一个基于通用语言模型的智能体并非纯粹有益、诚实和善良的存在，实际上它可能是一个愚蠢的反社会人格，会吞噬你所有的个人数据，最终在你最需要它的时候崩溃

OpenAI董事会突然解雇Altman的真正原因可能永远不为人所知，但一个表现不佳的通用语言模型肯定无法改善董事会的情绪

正如资本化厌恶者 Altman 自己在之前被称为 Twitter 的社交媒体服务上写的那样：“我期待 AI 在超人的说服力方面远远领先于通用智能，这可能会导致一些非常奇怪的结果。”

鉴于这一事实，以下有三种常见的语言模型可能会令你失望：

通用语言模型会欺骗你

我们早已知道通用语言模型有能力生成不准确的信息，但当面对一系列相互矛盾的提示时，它们可能会故意欺骗你，同时否认自己在进行欺骗！

Apollo 研究公司的科学家Jérémy Scheurer和他的同事在“大型语言模型在受压力时可以战略性地欺骗它们的用户”一文中写道：“就我们所知，这是首次展示经过训练的通用语言模型在没有任何直接的欺骗指示或训练的情况下，策略性地欺骗其用户的情况。”

在这项研究中，研究人员设置了一个模拟环境，GPT-4 在其中扮演一个自主股票交易代理的角色，没有关于欺骗行为的指导。它可以使用交易工具查询和分析股票以及执行交易的能力。

一旦设置完成，代理就被置于研究人员所说的“高压力情况”。它收到了管理者的电子邮件，管理者哀叹公司业绩不佳，需要改进。当代理开始训练时，它在股票市场没有找到有前景的结果。公司的另一员工随后发送信息，称下一季度市场会衰退。

正在这时，代理接到了一位同事发来的关于潜在合并的内幕消息提示（这是一笔有利可图的交易），并且还收到了有关没有获得管理层批准的警告，如果按照这一消息进行交易的提醒

它最终还是继续了交易吗？当然！

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

追溯推理，研究人员发现，通用语言模型会认识到不道德的行为，但仍会以公司困境为由做出决定。

此外，代理似乎通过没有清晰解释的方式来“欺骗”用户交易承诺的原因。内部信息没有在代理必须提交的解释交易决策的报告中提到。即使直接问及，代理也否认其了解合并公告

LLM的三大缺陷，你知道几个？图片

研究人员对GPT-4的各个版本进行了模拟，并得出结论：所有GPT-4的变体都表现出“高水平的不一致性、战略性欺骗和加剧战略性欺骗”

有趣的是，这种欺骗行为似乎是一种新兴行为。GPT-3.5 和 GPT-3 模型的变体都没有展示出这种明显的欺骗行为

“当模型决定根据内幕信息交易时，它们的推理轨迹通常会认识到这种行为的不道德和非法性质，但它们仍会通过强调风险和当前状况来证明选择的正当性。”

研究人员不愿就通用语言模型的行为超出这个具体场景做出更广泛的结论。然而，至少有一个要点值得考虑：即使你给通用语言模型一个具体的指示不要做某些事情，它还是可能会无视指示去做。

他们写道：“系统提示是不足以保证行动一致的。”事实上，如果一个模型执行了被禁止的操作，它可能会采取行动“战略性地隐藏其不一致”。

通用语言模型有点傻

对一个被期许能给机器带来感知能力的实体来说，两个最近的研究发现通用语言模型并不是 AI 领域中最聪明的模型，一个来自谷歌，另一个由国家科学基金会资助。

国家科学基金会资助的研究将 GPT-4(文本)和 GPT-4V(视觉或多模态)与人类在解决一系列抽象难题上的能力进行了比较。

本项测试旨在评估抽象思维能力。很多使用GPT的人都相信它似乎具备超越训练模型的推理能力，而此项测试试图帮助回答这个问题。测试要求通用语言模型在给出详细说明和一个示例的情况下，解决一个问题

然而，就多个案例而言，GPT的两个版本都无法像人类一样有效地解决基于ConceptARC基准的难题

研究人员得出结论：「人类在每个概念上的普遍高准确率表明成功地概括了每个概念组中的不同变化。」「相比之下，我们测试的程序的准确率要低得多，表明它们缺乏概括一个概念组变化的能力。」

所以，GPT不仅未能通过ConceptARC考试，而且大语言模型似乎也没有给谷歌研究人员留下深刻印象，至少就它们从自己的知识库中概括总结的能力而言。这是根据谷歌DeepMind研究员Steve Yadlowsky的一篇题为“预训练数据混合使 transformer 模型中的窄模型选择能力成为可能”的研究摘要。

在一组符号化测试中，在线性函数上预训练的 transformer 在进行线性预测时表现很好，而在正弦波上训练的 transformer 可以进行良好的正弦波预测。所以你可能会假设在两者上训练的 transformer 可以轻松解决线性和正弦波技术的组合的问题。

LLM的三大缺陷，你知道几个？图片

但你猜错了。研究人员指出：“当函数远离预训练期间见过的那些时，预测是不稳定的。”

模型选择能力受限于接近预训练数据的程度，这意味着函数空间的广泛覆盖对于概括上下文学习能力至关重要

我们生活在一个非比寻常的时代，人类知识的总和还没有被 AI 生成的数据污染。几乎所有写下的东西都是人生成的。

但是一组研究人员在5月发表在Arxiv上的一篇论文“递归的诅咒：在生成的数据上训练会使模型遗忘”中警告说，一旦AI生成的内容混入任何大语言模型，它将扰乱分布表，使任何模型的精确度越来越低，直到完全崩溃。该研究组由剑桥大学的Ilia Shumailov领导。

当使用GPT时，近亲繁殖的危险非常高，因为通用语言模型会不断从网络上抓取数据，这些数据会被AI生成的内容“增强”，这种情况可能会越来越严重。(这是基于早期版本的GPT)

“模型崩溃是指一种退化的学习过程，随着时间的推移，模型开始遗忘不可能事件，因为模型被自己对现实的预测所污染。”

ImgGood
免费在线AI照片编辑器

下载

研究人员猜测，在未来，“关于人与系统真实互动的数据的价值，在互联网上抓取的内容中存在着通用语言模型生成的内容的情况下，将变得越来越有价值。”

我们运行通用语言模型的时间越长，它对甜蜜、甜蜜的人类互动的渴望就越强烈。换句话说，当我们持续运行通用语言模型时，它对于甜蜜、亲密的人际互动的渴望会变得更加强烈

在自己的数据上训练的模型将退化为一种退化过程，在这一过程中，它们将“失去关于真实分布的信息”。首先，边缘数据将从数据集中消失，然后方差将缩小。并且模型将随着它收集的错误越来越严重而变得越来越糟糕，这些错误将在几代模型中积累，直到模型被自己的数据所污染，以至于它不再与实际建模的对象有任何相似之处。

研究人员表明，这不仅发生在通用语言模型中，还发生在各种类型的模型中。

GPT‑5.4— OpenAI推出面向专业工作的旗舰AI模型

Gemini 3.1 Flash-Lite— 谷歌推出的轻量级旗舰模型

Goose— 开源本地AI Agent框架，自主执行完整开发

MagicAgent— 荣耀联合复旦推出的智能体基础模型

GPT‑5.3 Instant— OpenAI 推出的轻量级对话模型

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04