5天用户破百万，ChatGPT背后有何玄机?

PHPz

发布时间：2023-05-04 10:19:06

1161人浏览过

来源于51CTO.COM

转载

译者 | 李睿

审校 | 孙淑娟

OpenAI又火了！近期许多人的朋友圈里都混进了一个让人既爱又怕的狠角色，以至于StackOverflow不得不急忙下架。

近日，OpenAI发布了聊天AI ChatGPT，短短几天，其用户量直冲百万级，甚至服务器一度被注册用户挤爆了。

这种被网友惊叹“超越谷歌搜索”的神器究竟怎么做到的？到底靠谱吗？

1、事件回顾

OpenAI公司日前发布了ChatGPT，这是另一个基于旗舰GPT系列的大型语言模型(LLM)，是一个专门用于对话交互的模型。用户可以下载该公司的免费演示版本。

与发布的大多数大型语言模型(LLM)一样，ChatGPT的发布也引发了一些争议。在发布之后的短短几个小时内，这个新的语言模型就在Twitter上引起了轰动，用户纷纷上传ChatGPT令人印象深刻的成就或者遭遇灾难性失败的截图。

然而，从大型语言模型的广泛角度来看，ChatGPT反映了该领域短暂而丰富的历史，代表了在短短几年内取得了多大的进展，以及还有哪些基本问题有待解决。

2、无监督学习的梦想

无监督学习仍然是人工智能社区追求的目标之一，而互联网上有大量宝贵的知识和信息。但直到最近，其中大部分的信息都无法用于机器学习系统。大多数机器学习和深度学习应用程序都是被监督的，这意味着人类必须采集大量数据样本并对每个样本进行注释，以训练机器学习系统。

随着Transformer架构（大型语言模型的关键组件）的出现，这种情况发生了变化。可以使用大量的无标记文本语料库来训练Transformer模型。它们随机屏蔽文本的部分，并试图预测缺失的部分。通过反复执行这一操作，Transformer调整其参数，以表示大序列中不同单词之间的关系。

这已被证明是一种非常有效和可扩展的策略。不需要人工标记，就可以收集非常大的训练语料库，从而允许创建和训练越来越大的Transformer模型。研究和实验表明，随着Transformer模型和大型语言模型（LLM）的规模增大，它们可以生成更长的连贯文本序列。大型语言模型（LLM）还展示了大规模的应急能力。

3、回归监督学习?

大型语言模型（LLM）通常只有文本，这意味着它们缺乏试图模仿的人类丰富的多感官体验。尽管GPT-3等大型语言模型（LLM）取得了令人印象深刻的成果，但它们存在一些基本缺陷，使得它们在需要常识、逻辑、规划、推理和其他知识的任务中无法预测，而这些知识通常在文本中被省略。大型语言模型（LLM）以产生幻觉反应、生成连贯但事实上虚假的文本以及经常误解用户提示的明显意图而闻名。

通过加大模型及其训练语料库的规模，科学家们已经能够减少大型语言模型中明显错误的频率。但根本的问题并没有消失，即使是最大的大型语言模型（LLM）也会在很小的推动下犯愚蠢的错误。

如果大型语言模型（LLM）只在科学研究实验室中用于跟踪基准测试的表现，这可能不会是一个大问题。然而，随着人们对在现实应用中使用大型语言模型（LLM）越来越感兴趣，解决这些问题和其他问题变得更加重要。工程师必须确保他们的机器学习模型在不同的条件下保持健壮，并满足用户的需求和要求。

DALL·E 2

OpenAI基于GPT-3模型开发的AI绘图生成工具，可以根据自然语言的描述创建逼真的图像和艺术。

下载

为了解决这一问题，OpenAI使用了来自人类反馈强化学习(RLHF)技术，该技术此前开发用于优化强化学习模型。人类反馈强化学习(RLHF)不是让强化学习模型随机探索其环境和行为，而是使用来自人类主管的偶尔反馈来引导代理朝正确的方向前进。人类反馈的强化学习(RLHF)的好处是，它能够以极小的人为反馈改善强化学习代理的训练。

OpenAI后来将人类反馈强化学习(RLHF)应用于InstructGPT，这是一个大型语言模型(LLM)系列，旨在更好地理解和响应用户提示中的指令。InstructGPT是一个GPT-3模型，它根据人类反馈进行了微调。

这显然是一种权衡。人工注释可能成为可扩展训练过程中的瓶颈。但通过在无监督学习和有监督学习之间找到正确的平衡，OpenAI能够获得重要的好处，包括更好地响应指令、减少有害输出和资源优化。根据OpenAI的研究结果，13亿个参数的InstructionGPT在指令跟随方面通常优于1750亿个参数GPT-3模型。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ChatGPT的训练过程

ChatGPT建立在从InstructGPT模型中获得的经验之上。人工注释器创建一组示例对话，其中包括用户提示和模型响应。这些数据用于微调构建ChatGPT所基于的GPT-3.5模型。在下一步中，将为经过微调的模型提供新的提示，并为其提供若干响应。标注人员对这些反应进行排名。然后，从这些交互中生成的数据被用于训练奖励模型，这有助于在强化学习管道中进一步微调大型语言模型(LLM)。

OpenAI尚未披露强化学习过程的全部细节，但人们很想知道这个过程的“不可扩展的成本”，也就是需要多少人力。

4、能在多大程度上信任ChatGPT?

ChatGPT的结果令人印象深刻。该模型已经完成了各种各样的任务，包括提供代码反馈、写诗、用不同的音调解释技术概念、为生成人工智能模型生成提示。

然而，该模型也容易出现类似大型语言模型（LLM）所犯的那种错误，例如引用不存在的论文和书籍，误解直观的物理学，以及在组合性方面失败。

人们对这些失败并不感到惊讶。ChatGPT并没有发挥什么神奇的作用，它应该遇到与它的前一代同样的问题。然而，在现实世界的应用中，可以在哪里以及在多大程度上信任它?显然，这里有一些有价值的内容，正如人们在Codex和GitHubCopilot中所看到的，大型语言模型（LLM）可以被非常有效地使用。

在这里，决定ChatGPT是否有用的是与它一起实现的工具和保护的种类。例如，ChatGPT可能成为为企业创建聊天机器人的一个非常好的平台，例如编码和图形设计的数字伴侣。首先，如果它遵循InstructGPT的示例，那么应该能够以更少的参数获得复杂模型的性能，这将使它具有成本效益。此外，如果OpenAI提供了工具，使企业能够实现自己的人类反馈强化学习(RLHF)的微调，那么它可以进一步针对特定应用程序进行优化，在大多数情况下，这比聊天机器人更有用，聊天机器人可以随意谈论任何事情。最后，如果为应用程序开发人员提供了将ChatGPT与应用程序场景集成，并将其输入和输出映射到特定应用程序事件和操作的工具，他们将能够设置正确的护栏，以防止模型采取不稳定的操作。

基本上，OpenAI创造了一个强大的人工智能工具，但具有明显的缺陷。它现在需要创建正确的开发工具生态系统，以确保产品团队能够利用ChatGPT的力量。GPT-3为许多不可预测的应用开辟了道路，因此了解ChatGPT的库存会很有趣。

原文链接：https://bdtechtalks.com/2022/12/05/openai-chatgpt/

ChatGPT高级语音模式配额用尽_等待24小时重置或切换至标准语音模式

ChatGPT提示此账号已被锁定保护_通过注册邮箱接收安全验证码进行身份验证解锁

什么是思维链(CoT)提示法？让ChatGPT回答更聪明的提问技巧

ChatGPT如何利用自定义指令优化面试表现_在指令中预设你的简历背景和目标岗位信息

ChatGPT生成的图片文字描述有误_在提示词中明确要求使用DALL-E 3的文字渲染功能

相关专题

俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总，涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

178

2026.01.28

包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口，涵盖备用域名、正版无广告链接及多端适配地址，助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

2026.01.28

ao3中文版官网地址大全

AO3最新中文版官网入口合集，汇总2026年主站及国内优化镜像链接，支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

2026.01.28

php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程，助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

2026.01.28

php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

2026.01.28

Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用，涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理，以及在高并发系统中的异步解耦设计。通过实战案例，帮助学习者掌握使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

2026.01.28

Python 自然语言处理（NLP）基础与实战

本专题系统讲解 Python 在自然语言处理（NLP）领域的基础方法与实战应用，涵盖文本预处理（分词、去停用词）、词性标注、命名实体识别、关键词提取、情感分析，以及常用 NLP 库（NLTK、spaCy）的核心用法。通过真实文本案例，帮助学习者掌握使用 Python 进行文本分析与语言数据处理的完整流程，适用于内容分析、舆情监测与智能文本应用场景。

2026.01.27