surveyforge是由上海ai lab联合复旦大学、上海交通大学等机构开发的一种创新性自动化生成高质量学术综述的框架。该框架采用两阶段结构,包括大纲生成和内容生成两个环节。在大纲生成阶段,利用双数据库协同驱动(研究论文数据库与综述大纲数据库)的启发式学习机制,构建出结构合理且逻辑清晰的综述框架。在内容生成阶段,则通过学者导航agent(sana),结合记忆模块与时间感知重排序引擎,实现对文献的精准检索并生成高质量内容。surveyforge还具备并行生成与协调能力,可高效产出连贯的长文档,生成一篇约64k token的综述仅需10分钟,成本低于0.5美元。此外,研究团队还构建了surveybench这一多维度评估基准,用于客观评价综述质量。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
SurveyForge的主要功能
- 高效生成综述:SurveyForge可在短时间内完成约64k token的综述撰写,全过程仅需10分钟,成本不到0.5美元。
- 高质量大纲生成:基于双数据库协同驱动的启发式学习机制,能够生成接近人工撰写水平的结构清晰、逻辑严密的综述大纲。
- 精准文献检索:学者导航Agent(SANA)能够准确检索相关主题的高质量文献,避免引用无关资料,提升文献的准确性和影响力。
- 内容优化与协调:依托并行生成与协调机制,在各章节独立生成后,通过精炼过程消除重复、理顺逻辑,确保整体内容连贯一致。
SurveyForge的技术原理
-
大纲生成阶段:
- 双数据库协同驱动:整合研究论文数据库(包含约60万篇arXiv计算机科学领域论文)与综述大纲数据库(收录约2万篇综述文章的层次化结构),通过跨数据库知识融合,学习专家级结构化模式。
- 递归构建策略:先生成体现全局逻辑的一级大纲,再针对每个章节结合具体领域文献细化二级结构,实现从宏观到微观的结构化学习。
-
内容生成阶段:
-
学者导航Agent(SANA):
- 子查询记忆模块:将大纲生成阶段检索到的文献作为记忆上下文,并结合原始查询进行处理,确保查询分解始终围绕核心主题,防止语义偏离。
- 检索记忆模块:将整个大纲相关的文献纳入全局记忆系统,根据嵌入相似度为每个子查询匹配最相关文献,提升检索精度与语义一致性。
- 时间感知重排序引擎:按发表时间对检索结果分组,并在组内依据引用数进行top-k筛选,兼顾经典权威与前沿研究成果的代表性。
- 并行生成与协调:各章节内容独立生成,借助共享的记忆系统确保整体统一性,再通过精炼阶段消除冗余、优化逻辑,最终形成连贯的整体。
-
学者导航Agent(SANA):
SurveyForge的项目地址
- GitHub仓库:https://www.php.cn/link/4d051fd50a4a48731b96e6df73367ef3
- HuggingFace模型库:https://www.php.cn/link/3111b2ff56ac8be7960156e3f116821b
- arXiv技术论文:https://www.php.cn/link/b6d0d3c61122345690a19bb8af632db4
SurveyForge的应用场景
- 学术研究:助力新进入者、跨学科研究者及资深学者快速掌握领域全貌,提高文献调研效率。
- 教育领域:辅助教师课程设计与学生自主学习,加快对专业领域知识的理解。
- 工业界:支持企业开展技术调研与行业分析,为研发决策提供数据支撑。
- 政策制定:为政策制定者提供科学参考,协助技术评估与战略规划。
- 个人学习与研究:帮助个体用户迅速了解感兴趣领域的最新动态,辅助科研写作。










