LangChain 中实现带记忆与检索的 Map-Reduce 链式问答

霞舞

发布时间：2026-03-15 17:51:11

405人浏览过

来源于php中文网

原创

LangChain 中实现带记忆与检索的 Map-Reduce 链式问答

本文详解如何在 langchain 中构建支持对话记忆（memory）、文档检索（retriever）与动态摘要机制（map_reduce）的 qa 链，并说明 map_reduce 本质即为应对长上下文超限场景而设计的分治式推理策略。

本文详解如何在 langchain 中构建支持对话记忆（memory）、文档检索（retriever）与动态摘要机制（map_reduce）的 qa 链，并说明 map_reduce 本质即为应对长上下文超限场景而设计的分治式推理策略。

在 LangChain 的链式架构中，map_reduce 并非“可选开关”，而是一种内置的、面向长文本处理的鲁棒性策略：当检索返回的文档片段总 token 数超出 LLM 上下文窗口限制时，它会自动将各段落分别摘要（Map 阶段），再将多个摘要合并后二次提炼（Reduce 阶段），最终生成符合 token 约束的连贯回答。因此，无需手动判断 token 超限——只要配置 chain_type="map_reduce"，框架即自动启用该流程。

但需注意：标准 ConversationalRetrievalChain 和 RetrievalQA 在设计上存在关键差异：

ConversationalRetrievalChain 原生支持 memory（如 ConversationBufferMemory），但不支持 chain_type="map_reduce" —— 它仅提供 stuff 和 refine 模式；
RetrievalQA.from_chain_type 支持 map_reduce，但默认不兼容对话记忆，因其原始设计聚焦单轮问答。

✅ 正确解法：使用 RetrievalQA 并显式注入 memory 实例到 chain_type_kwargs 中（LangChain v0.1+ 已支持此模式）。以下是完整、可运行的配置示例：

小羊标书

一键生成百页标书，让投标更简单高效

下载

from langchain.chains import RetrievalQA
from langchain.memory import ConversationBufferMemory
from langchain.prompts import PromptTemplate
from langchain.chat_models import ChatOpenAI

# 1. 初始化记忆组件（支持多轮上下文）
memory = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True,  # 确保返回 Message 对象而非字符串
    input_key="question",
    output_key="answer"
)

# 2. 自定义 prompt（必须包含 chat_history 占位符）
prompt_template = """你是一个专业助手。请结合以下历史对话和最新问题，给出准确、简洁的回答。
聊天历史：
{chat_history}

最新问题：
{question}

相关文档：
{context}

请基于以上信息作答，不要编造内容。
"""
PROMPT = PromptTemplate(
    template=prompt_template,
    input_variables=["chat_history", "question", "context"]
)

# 3. 构建 map_reduce 链（关键：memory 传入 chain_type_kwargs）
qa_chain = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(model="gpt-4-turbo", temperature=0),
    chain_type="map_reduce",
    retriever=retriever,  # 替换为你的 VectorStoreRetriever 实例
    chain_type_kwargs={
        "prompt": PROMPT,
        "memory": memory  # ✅ 显式注入 memory
    },
    return_source_documents=True,
    verbose=True
)

# 使用示例
response = qa_chain({"question": "LangChain 的 Memory 如何工作？"})
print("答案：", response["answer"])
print("来源文档数：", len(response["source_documents"]))

⚠️ 重要注意事项：

Prompt 必须显式声明 {chat_history} 变量，否则 memory 不会被注入提示词；
memory.return_messages=True 是与 ChatModel 兼容的前提（避免字符串/Message 类型冲突）；
map_reduce 的 Reduce 阶段仍受模型最大输出长度限制，若摘要层级过深，可考虑调小 chain_type_kwargs["reduce_k"]（默认为 4）以控制中间摘要数量；
若需更高阶的对话状态管理（如槽位填充、意图识别），建议升级至 LangChain Expression Language（LCEL）范式，用 RunnableWithMessageHistory 组合 retriever + llm + memory，获得更灵活的控制权。

总结而言，map_reduce 是 LangChain 应对长文档问答的“安全阀”，而通过 RetrievalQA.from_chain_type 合理注入 memory，即可在保障 token 合规性的同时，实现真正意义上的有记忆、可检索、自适应摘要的智能问答链。

相关标签:

架构 Token 字符串 map langchain prompt

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何将 pip 缓存目录迁移到其他磁盘以释放 C 盘空间下一篇：暂无

作者最新文章

猫眼电影怎么进行影评与评分

2026-03-15 14:17

Pandas 中按 code 分组前向填充 -1 值并按时间排序的正确实现

2026-03-15 14:43

如何在 Python 中约束可变参数函数的所有参数均为 JSON 兼容类型

2026-03-15 14:50

如何使用 Eloquent 高效筛选至少关联一个子模型的父级集合

2026-03-15 14:56

研究发现《我的世界》和《罗布乐思》玩家较少游玩3A新作

2026-03-15 14:56

TypeScript ESM 导入中解决无扩展名路径报错的正确配置方案

2026-03-15 15:08

Go 语言中如何在函数内部定义带方法的结构体（模拟接口实现的正确姿势）

2026-03-15 15:16

如何在 Python 中优雅地调用登录成功后的函数

2026-03-15 15:26

如何在 OpenAI 响应中正确移除多行代码块的三重反引号（）标记

2026-03-15 15:39

眼镜到底有多暴利：标价799元的镜片进价仅15元

2026-03-15 15:47

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6657

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

845

2023.09.14