ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

WBOY

发布时间：2024-04-15 15:30:02

1404人浏览过

来源于51CTO.COM

转载

reft(representation finetuning)是一种突破性的方法，有望重新定义我们对大型语言模型进行微调的方式。

斯坦福大学的研究人员最近（4月）在arxiv上发布的论文，ReFT与传统的基于权重的微调方法大有不同，它提供了一种更高效和有效的方法来适应这些大规模的模型，以适应新的任务和领域！

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

在介绍这篇论文之前，我们先看看PeFT。

参数高效微调 PeFT

Parameter Efficient Fine-Tuning（PEFT）是一种微调少量或额外的模型参数的高效微调方法。与传统的预测网络微调方法相比，使用PEFT进行微调可以大幅降低计算和存储成本，同时保证了与全量微调相当的性能。此技术的应用范围非常广泛，并且能够实现与全量微调相当的性能。

在PeFT的思想之上就产生了我们非常熟悉的LoRA，还有各种LoRA的变体，除了有名的LoRA之外常用的PeFT方法还有：

Prefix Tuning：通过virtual token构造连续型隐式prompt ，这是21年斯坦福发布的方法。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

P-Tuning V1/V2 是由清华大学在2021年提出的技术，旨在将自然语言的离散模型转换为可训练的隐式prompt（连续参数优化问题）。V2版本通过在输入前的每层添加可微调的参数，进一步增强了V1版本的性能。这种方法有效地扩展了模型的应用范围和灵活性。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

然后就是我们熟悉的也是最长用的LoRA，这里就不多介绍了，我们可以狭义理解为LoRA是目前最好的PeFT方法，这样可以对我们下面介绍的ReFT更好的对比。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

表征微调 ReFT

ReFT (Representation Finetuning)是一组专注于在推理过程中对语言模型的隐藏表示学习干预的方法，而不是直接修改其权重。

与更新模型整个参数集的传统微调方法不同，ReFT通过策略性地操纵模型表示的一小部分来操作，指导其行为以更有效地解决下游任务。

ReFT背后的核心思想受到最近语言模型可解释性研究的启发：在这些模型学习的表示中编码了丰富的语义信息。通过干预这些表示，ReFT旨在解锁和利用这些编码知识，实现更高效和有效的模型适应。

ReFT的一个关键优点是它的参数效率：传统的微调方法需要更新模型参数的很大一部分，这可能是计算昂贵和资源密集的，特别是对于具有数十亿参数的大型语言模型。ReFT方法通常需要训练数量级更少的参数，从而获得更快的训练时间和更少的内存需求。

ReFT与PeFT有何不同

ReFT与传统PEFT方法在几个关键方面有所不同：

1、干预目标

PEFT方法，例如，LoRA、DoRA和prefix-tuning，侧重于修改模型的权重或引入额外的权重矩阵。而ReFT方法不直接修改模型的权重;它们会干预模型在向前传递期间计算的隐藏表示。

2、适应机制

像LoRA和DoRA这样的PEFT方法学习权重更新或模型权重矩阵的低秩近似值。然后在推理期间将这些权重更新合并到基本模型的权重中，从而不会产生额外的计算开销。ReFT方法学习干预，在推理过程中在特定层和位置操纵模型的表示。此干预过程会产生一些计算开销，但可以实现更有效的适应。

3、动机

PEFT方法的主要动机是对参数有效适应的需求，减少了调优大型语言模型的计算成本和内存需求。另一方面，ReFT方法受到最近语言模型可解释性研究的启发，该研究表明，在这些模型学习的表示中编码了丰富的语义信息。ReFT的目标是利用和利用这些编码的知识来更有效地适应模型。

4.参数效率

PEFT和ReFT方法都是为了参数效率而设计的，但ReFT方法在实践中证明了更高的参数效率。例如LoReFT(低秩线性子空间ReFT)方法通常需要训练的参数比最先进的PEFT方法(LoRA)少10-50倍，同时在各种NLP基准测试中获得具有竞争力或更好的性能。

5、可解释性

虽然PEFT方法主要侧重于有效的适应，但ReFT方法在可解释性方面提供了额外的优势。通过干预已知编码特定语义信息的表示，ReFT方法可以深入了解语言模型如何处理和理解语言，从而可能导致更透明和值得信赖的人工智能系统。

ReFT架构

ReFT模型体系结构定义了干预的一般概念，这基本上意味着在模型向前传递期间对隐藏表示的修改。我们首先考虑一个基于transformer的语言模型，该模型生成标记序列的上下文化表示。

给定一个n个输入令牌序列x = (x₁，…，xn)，模型首先将其嵌入到一个表示列表中，就h₁，…，hn。然后m层连续计算第j个隐藏表示，每一个隐藏的表示都是一个向量h∈λ，其中d是表示的维数。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

ReFT定义了一个干预的概念，它在模型向前传递期间修改隐藏的表示。

干预I是一个元组⟨Φ， P, L⟩，它封装了由基于transformer的LM计算的表示的单个推理时间的干预动作，这个函数包含了三个参数:

OmniAudio

OmniAudio 是一款通过 AI 支持将网页、Word 文档、Gmail 内容、文本片段、视频音频文件都转换为音频播客，并生成可在常见 Podcast ap

下载

干预函数Φ:用学习到的参数Φ (Φ)来表示。

干预所应用的一组输入位置P≤{1，…，n}。

对层L∈{1，…，m}进行干预。

然后，干预的动作如下：

h⁽ˡ⁾ ← (Φ(h_p⁽ˡ⁾) if p ∈ P else h_p⁽ˡ⁾)_{p∈1,…,n}

该干预在前向传播计算完后立即进行，所以会影响到后续层中计算的表示。

为了提高计算的效率，也可以将干预的权重进行低秩分解，也就是得到了低秩线性子空间ReFT (LoReFT)。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

在上面的公式中使用学习到的投影源Rs = Wh +b。LoReFT编辑R列的R维子空间中的表示，来或取从我们的线性投影Wh +b中获得的值。

对于生成任务，ReFT论文使用语言建模的训练目标，重点是在所有输出位置上使用最小化交叉熵损失。

pyreft库代码示例

斯坦福大学的研究人员在发布论文的同时还发布了pyreft库，这是一个建立在pyvene之上用于在任意PyTorch模型上执行和训练激活干预的库。

pyreft可以兼容HuggingFace上可用的任何预训练语言模型，并且可以使用ReFT方法进行微调。以下是如何将lama- 27b模型的第19层输出进行单一干预的代码示例：

import torch import transformers from pyreft import ( get_reft_model, ReftConfig, LoreftIntervention, ReftTrainerForCausalLM ) # Loading HuggingFace model model_name_or_path = "yahma/llama-7b-hf" model = transformers.AutoModelForCausalLM.from_pretrained( model_name_or_path, torch_dtype=torch.bfloat16, device_map="cuda" ) # Wrap the model with rank-1 constant reFT reft_config = ReftConfig( representations={ "layer": 19, "component": "block_output", "intervention": LoreftIntervention( embed_dim=model.config.hidden_size, low_rank_dimension=1),} ) reft_model = get_reft_model(model, reft_config) reft_model.print_trainable_parameters()

剩下的代码就和HuggingFace训练模型没有任何的区别了，我们来做一个完整的演示：

from pyreft import ( ReftTrainerForCausalLM, make_last_position_supervised_data_module ) tokenizer = transformers.AutoTokenizer.from_pretrained( model_name_or_path, model_max_length=2048, padding_side="right", use_fast=False) tokenizer.pad_token = tokenizer.unk_token  # get training data to train our intervention to remember the following sequence memo_sequence = """ Welcome to the Natural Language Processing Group at Stanford University! We are a passionate, inclusive group of students and faculty, postdocs and research engineers, who work together on algorithms that allow computers to process, generate, and understand human languages. Our interests are very broad, including basic scientific research on computational linguistics, machine learning, practical applications of human language technology, and interdisciplinary work in computational social science and cognitive science. We also develop a wide variety of educational materials on NLP and many tools for the community to use, including the Stanza toolkit which processes text in over 60 human languages. """ data_module = make_last_position_supervised_data_module( tokenizer=tokenizer, model=model, inputs=["GO->"], outputs=[memo_sequence])  # train training_args = transformers.TrainingArguments( num_train_epochs=1000.0, output_dir="./tmp", learning_rate=2e-3, logging_steps=50) trainer = ReftTrainerForCausalLM( model=reft_model, tokenizer=tokenizer, args=training_args, **data_module) _ = trainer.train()

一旦完成训练，就可以检查模型信息：

prompt = tokenizer("GO->", return_tensors="pt").to("cuda") base_unit_location = prompt["input_ids"].shape[-1] - 1# last position _, reft_response = reft_model.generate( prompt, unit_locations={"sources->base": (None, [[[base_unit_location]]])}, intervene_on_prompt=True, max_new_tokens=512, do_sample=False,  eos_token_id=tokenizer.eos_token_id, early_stopping=True ) print(tokenizer.decode(reft_response[0], skip_special_tokens=True))

LoReFT的性能测试

最后我们来看看它在各种NLP基准测试中的卓越表现，以下是斯坦福大学的研究人员展示的数据。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

LoReFT在8个具有挑战性的数据集上获得了最先进的性能，包括BoolQ、PIQA、SIQA、HellaSwag、WinoGrande、ARC-e、ARC-c和OBQA。尽管使用的参数比现有的PEFT方法少得多(少10-50倍)，但LoReFT的性能还是大大超过了所有其他方法，展示了它有效捕获和利用大型语言模型中编码的常识性知识的能力。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

虽然LoReFT在数学推理任务上没有超过现有的PEFT方法，但它在AQuA、GSM8K、MAWPS和SVAMP等数据集上展示了具有竞争力的性能。研究人员指出LoReFT的性能随着模型尺寸的增大而提高，这表明它的能力随着语言模型的不断增长而扩大。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

在指令遵循领域，LoReFT取得了显著的结果，在Alpaca-Eval v1.0基准测试上优于所有的微调方法，包括完全微调（这个要注重说明）。当在llama - 27b模型上训练时，LoReFT的比GPT-3.5 Turbo模型的还要好1%，同时使用的参数比其他PEFT方法少得多。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

LoReFT还展示了其在自然语言理解任务中的能力，当应用于RoBERTa-base和RoBERTa-large模型时，在GLUE基准测试中实现了与现有PEFT方法相当的性能。

当在参数数量上与之前最有效的PEFT方法相匹配时，LoReFT在各种任务中获得了相似的分数，包括情感分析和自然语言推理。

ReFT(表征微调)：比PeFT效果更好的新的大语言模型微调技术

总结

ReFT特别是LoReFT的成功，对自然语言处理的未来和大型语言模型的实际应用具有重要意义。ReFT的参数效率使其成为一种使大型语言模型适应特定的任务或领域，同时最大限度地减少计算资源和训练时间的有效的解决方案。

并且ReFT还提供了一个独特的视角来增强大型语言模型的可解释性。在常识推理、算术推理和指令遵循等任务中的成功表明该方法的有效性。目前来看ReFT有望开启新的可能性，克服传统调优方法的局限性。

提升LLM性能：RAG、微调和提示工程深度解析

Open Interpreter— 开源AI终端助手，本地环境执行代码

Home Assistant LLM: AI驱动家庭安全终极指南

ChatGPT内容检测工具：原理、使用与未来发展

Gemini 3.0颠覆AI格局？泄露信息深度分析与未来展望

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6655

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

844

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1092

2023.12.21

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

2209

2024.03.01

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

469

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

Python 自然语言处理（NLP）基础与实战

本专题系统讲解 Python 在自然语言处理（NLP）领域的基础方法与实战应用，涵盖文本预处理（分词、去停用词）、词性标注、命名实体识别、关键词提取、情感分析，以及常用 NLP 库（NLTK、spaCy）的核心用法。通过真实文本案例，帮助学习者掌握使用 Python 进行文本分析与语言数据处理的完整流程，适用于内容分析、舆情监测与智能文本应用场景。

418

2026.01.27

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

热门下载

网站特效

网站源码

网站素材

前端模板