讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 AI 提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

参数少量提升，性能指数爆发！谷歌：大语言模型暗藏「神秘技能」

王林

发布时间：2023-04-11 23:16:10

|

1697人浏览过

|

来源于51CTO.COM

转载

由于可以做一些没训练过的事情，大型语言模型似乎具有某种魔力，也因此成为了媒体和研究员炒作和关注的焦点。

当扩展大型语言模型时，偶尔会出现一些较小模型没有的新能力，这种类似于「创造力」的属性被称作「突现」能力，代表我们向通用人工智能迈进了一大步。

如今，来自谷歌、斯坦福、Deepmind和北卡罗来纳大学的研究人员，正在探索大型语言模型中的「突现」能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

解码器提示的 DALL-E

神奇的「突现」能力

自然语言处理（NLP）已经被基于大量文本数据训练的语言模型彻底改变。扩大语言模型的规模通常会提高一系列下游NLP任务的性能和样本效率。

在许多情况下，我们可以通过推断较小模型的性能趋势预测大型语言模型的性能。例如，规模对语言模型困惑的影响已被验证跨越超过七个数量级。

然而，某些其他任务的性能却并没有以可预测的方式提高。

例如，GPT-3的论文表明，语言模型执行多位数加法的能力对于从100M到13B参数的模型具有平坦的缩放曲线，近似随机，但会在一个节点造成性能的飞升。

鉴于语言模型在NLP研究中的应用越来越多，因此更好地理解这些可能意外出现的能力非常重要。

在近期发表在机器学习研究（TMLR）上的论文「大型语言模型的突现能力」中，研究人员展示了数十个扩展语言模型所产生的「突现」能力的例子。

这种「突现」能力的存在提出了一个问题，即额外的缩放是否能进一步扩大语言模型的能力范围。

某些提示和微调方法只会在更大的模型中产生改进

「突现」提示任务

首先，我们讨论在提示任务中可能出现的「突现」能力。

在此类任务中，预先训练的语言模型会被提示执行下一个单词预测的任务，并通过完成响应来执行任务。

如果没有任何进一步的微调，语言模型通常可以执行训练期间没有看到的任务。

当任务在特定规模阈值下不可预测地从随机性能飙升至高于随机性能时，我们将其称为「突现」任务。

下面我们展示了三个具有「突现」表现的提示任务示例：多步算术、参加大学水平的考试和识别单词的预期含义。

在每种情况下，语言模型的表现都很差，对模型大小的依赖性很小，直到达到某个阈值——它们的性能骤升。

对于足够规模的模型，这些任务的性能只会变得非随机——例如，算术和多任务NLU任务的训练每秒浮点运算次数（FLOP）超过10的22次方，上下文任务中单词的训练FLOP超过10的24次方。

「突现」提示策略

第二类「突现」能力包括增强语言模型能力的提示策略。

提示策略是用于提示的广泛范式，可应用于一系列不同的任务。当它们对小型模型失败并且只能由足够大的模型使用时，它们被认为是可「突现」的。

思维链提示是「突现」提示策略的一个典型示例，提示模型在给出最终答案之前生成一系列中间步骤。

思维链提示使语言模型能够执行需要复杂推理的任务，例如多步数学单词问题。

值得一提的是，模型无需经过明确培训即可获得思维链推理的能力，下图则显示了一个思维链提示的示例。

思维链提示的实证结果如下所示。

对于较小的模型，应用思维链提示并不会优于标准提示，例如当应用于GSM8K时，这是一个具有挑战性的数学文字问题基准。

然而对于大型模型，思维链提示在GSM8K上达到了57%的解决率，在我们的测试中性能显著提升。

研究「突现」能力的意义

那么研究「突现」能力，又究竟有什么意义呢？

识别大型语言模型中的「突现」能力，是理解此类现象及其对未来模型能力的潜在影响的第一步。

例如，由于「突现」小样本提示能力和策略没有在预训练中明确编码，研究人员可能不知道当前语言模型的小样本提示能力的全部范围。

此外，进一步扩展是否会潜在地赋予更大的模型「突现」能力，这个问题同样十分重要。

为什么会出现「突现」能力？
当某些能力出现时，语言模型的新现实世界应用会被解锁吗？
由于计算资源昂贵，能否在不增加扩展性的情况下通过其他方法解锁突现」能力（例如更好的模型架构或训练技术）？

研究人员表示，这些问题尚且不得而知。

不过随着NLP领域的不断发展，分析和理解语言模型的行为，包括由缩放产生的「突现」能力，是十分重要的。

相关文章

MiniMax Music 2.5— MiniMax推出的AI音乐创作模型

AI写歌词教程，Suno和Udio如何协同创作？

5分钟上手Clawdbot！风靡硅谷的开源AI神器，到底怎么玩？

AI生成活动现场的即时新闻稿

Gemini如何根据图片生成精美的谷歌幻灯片_要求AI输出Slide大纲并利用脚本自动填充

数码产品性能查询

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

谷歌

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：智能汽车规划控制常用控制方法详解下一篇：ConvNeXt V2来了，仅用最简单的卷积架构，性能不输Transformer

作者最新文章

还在为Magento2慢吞吞的搜索发愁？AlgoliaSearch&Discovery助你打造闪电般的用户体验！

2025-09-16 10:34

如何解决电商库存管理混乱难题？Spryker/Stock模块助你轻松搞定！

2025-09-16 11:12

快速上手夸克浏览器AI搜索_夸克AI搜索保姆级图文教程

2025-10-14 20:48

夸克浏览器AI搜索无法使用_解决夸克AI搜索问题的有效方法

2025-10-15 14:04

夸克浏览器AI搜索设置教程_夸克AI搜索功能详细开启步骤

2025-10-18 13:32

夸克浏览器AI搜索结果不准_优化夸克AI搜索设置的技巧

2025-10-26 10:58

微信朋友圈定时发送神器微信自动发朋友圈软件推荐与使用

2026-01-04 12:22

抖音火山版免费下载电脑版抖音火山版电脑版免费下载入口

2026-01-04 14:33

必应搜索怎样结合演员名找其主演电视剧_必应搜索用演员搜剧技巧【精要】

2026-01-07 17:31

微信自动发朋友圈怎么设置微信朋友圈一键定时发送方法

2026-01-16 12:58

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

更多

go语言注释编码

go语言注释编码

本专题整合了go语言注释、注释规范等等内容，阅读专题下面的文章了解更多详细内容。

2

2026.01.31

go语言 math包

go语言 math包

本专题整合了go语言math包相关内容，阅读专题下面的文章了解更多详细内容。

1

2026.01.31

go语言输入函数

go语言输入函数

本专题整合了go语言输入相关教程内容，阅读专题下面的文章了解更多详细内容。

1

2026.01.31

golang 循环遍历

golang 循环遍历

本专题整合了golang循环遍历相关教程，阅读专题下面的文章了解更多详细内容。

0

2026.01.31

Golang人工智能合集

Golang人工智能合集

本专题整合了Golang人工智能相关内容，阅读专题下面的文章了解更多详细内容。

1

2026.01.31

2026赚钱平台入口大全

2026赚钱平台入口大全

2026年最新赚钱平台入口汇总，涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道，助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

76

2026.01.31

高干文在线阅读网站大全

高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源，涵盖都市言情、京味大院、军旅高干等经典题材，情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

73

2026.01.31

无需付费的漫画app大全

无需付费的漫画app大全

想找真正免费又无套路的漫画App？本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用，涵盖国漫、日漫、韩漫及经典老番，满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

67

2026.01.31

漫画免费在线观看地址大全

漫画免费在线观看地址大全

想找免费又资源丰富的漫画网站？本合集精选2025-2026年热门平台，涵盖国漫、日漫、韩漫等多类型作品，支持高清流畅阅读与离线缓存。阅读专题下面的文章了解更多详细内容。

19

2026.01.31

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

550W粉丝大佬手把手从零学JavaScript

550W粉丝大佬手把手从零学JavaScript

共1课时 | 0.3万人学习

尚硅谷JavaScript高级视频教程

尚硅谷JavaScript高级视频教程

共48课时 | 14.7万人学习

尚硅谷自动化构建工具Maven视频教程

尚硅谷自动化构建工具Maven视频教程

共35课时 | 7.3万人学习

最新文章

更多

SenseNova-MARS— 商汤科技开源的多模态自主推理模型

阿里千问2026最新网页版阿里千问在线登录入口

deepseek官网提示词有哪些官方示例与使用说明

Clawdbot导出数据格式怎么选 CSV与Excel文件保存方法

deepseek无屏蔽词教程 DeepSeek全功能提示词使用方法

clawdbot网页端登录页面 clawdbot官方入口解析

Clawdbot触发器怎么使用满足特定条件自动执行任务方法

豆包提示词设置在哪里提示词参数配置说明

豆包生成的文件怎么下载下来文件保存操作指南

文心一格Ai一键文生图支持中文吗_文心一格中文文生图用法【说明】

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部