0

0

C++如何利用std::variant与访问者模式实现类型安全的解析器?(编译器前端)

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-03-07 15:03:11

|

371人浏览过

|

来源于php中文网

原创

适合存入 std::variant 的 ast 节点类型是值语义、可拷贝、无虚函数的独立 struct(如 binaryop、intliteral、identifier),字段全用值类型,且需默认构造;必须用 std::visit 配合显式重载访问者类保障穷举安全,禁用 std::get 和裸指针。

c++如何利用std::variant与访问者模式实现类型安全的解析器?(编译器前端)

std::variant 里存什么类型才适合做 AST 节点?

AST 节点必须是值语义、可拷贝、无虚函数——否则 std::variant 编译失败或运行时崩溃。常见错误是往里面塞 std::unique_ptr<basenode></basenode> 或带虚析构的基类指针,这会让 std::variant 的拷贝/移动语义失效。

正确做法是把每种节点定义为独立的 struct,字段全用值类型(std::stringintstd::vector),再统一放进 std::variant

struct BinaryOp { std::string op; Expr lhs; Expr rhs; };
struct IntLiteral { int value; };
struct Identifier { std::string name; };
using Expr = std::variant<BinaryOp, IntLiteral, Identifier>;
  • Expr 必须能默认构造(否则 std::variant 初始化失败),所以每个成员 struct 都要有默认构造函数或聚合初始化支持
  • 避免在节点里存裸指针或 std::shared_ptr —— 它们会让访问逻辑变重,且破坏栈语义
  • 如果节点需要递归嵌套(比如 BinaryOp::lhs 是另一个 Expr),确保 Expr 在定义完成前已声明(用 using 提前声明 + 后置定义)

std::visit 怎么写访问者才能不漏分支、不崩掉?

直接传 lambda 给 std::visit 很容易漏处理某个 std::variant 的备选项,编译器不报错,但运行时抛 std::bad_variant_access。根本原因是 lambda 没覆盖所有类型,而 std::visit 的重载解析是静态的,不强制穷举。

可靠做法是写一个显式的访问者类,继承 std::variant::visitor 并用 auto operator() 重载全部可能类型:

立即学习前端免费学习笔记(深入)”;

Reecho睿声
Reecho睿声

Reecho AI:超拟真语音合成与瞬时语音克隆平台

下载
struct ExprPrinter {
  void operator()(const BinaryOp& e) { /* ... */ }
  void operator()(const IntLiteral& e) { /* ... */ }
  void operator()(const Identifier& e) { /* ... */ }
};
std::visit(ExprPrinter{}, expr);
  • 少写一个 operator(),编译就报错(C++17 起),比 lambda 安全得多
  • 不要用 auto 模板参数捕获所有类型(template<typename t> void operator()(const T&)</typename>),它会吞掉所有类型,掩盖漏处理问题
  • 如果访问者要带状态(比如缩进计数器),用成员变量而非捕获,否则跨线程或递归访问时行为不可控

为什么不能直接用 std::get(v) 做类型分发?

std::get<t>(v)</t> 在类型不匹配时抛异常,不是编译期检查。在解析器这种高频路径上,靠异常做控制流等于主动引入性能雷区,而且掩盖了“本该静态确定”的类型逻辑。

更严重的是:一旦 std::variant 新增一种节点类型,所有用 std::get 的地方都得手动加 try/catch 或重复判断,极易遗漏。

  • std::holds_alternative<t>(v)</t> + std::get<t></t> 组合虽能避免异常,但仍是运行时分支,且代码冗长
  • std::visit 是唯一能静态保证穷举、零开销抽象的方案——编译器生成的就是跳转表或 if-else 链,没虚调用也没异常开销
  • 某些旧编译器(如 GCC 7.5 之前)对 std::visit 的 SFINAE 支持不全,遇到模板访问者可能静默失败;建议锁死 GCC 8+ / Clang 6+

访问者返回值怎么统一又不失类型信息?

解析器常需从不同节点生成不同类型的中间结果(比如 BinaryOp 返回 IR::BinaryInst*IntLiteral 返回 IR::Constant*),但 std::visit 要求所有重载返回同一类型。

解法是用 std::variant 套一层返回值,或者用 std::optional<t></t> + 断言,但最实用的是让访问者返回一个通用句柄(如 std::shared_ptr<:value></:value>),再在各 operator() 里做具体构造:

struct CodeGenVisitor {
  std::shared_ptr<IR::Value> operator()(const BinaryOp& e) {
    return std::make_shared<IR::BinaryInst>(e.op, ...);
  }
  std::shared_ptr<IR::Value> operator()(const IntLiteral& e) {
    return std::make_shared<IR::Constant>(e.value);
  }
};
  • 别用 void 返回值然后靠成员变量攒结果——多层嵌套访问时状态混乱,线程不安全
  • 如果 IR 层本身也是 std::variant,注意避免返回值嵌套过深(如 std::variant<:variant>></:variant>),会拖慢编译和 debug 体验
  • 返回智能指针时,确保底层 IR 类型没有循环引用,否则 GC 或析构会卡住

类型安全不是靠运行时检查堆出来的,而是靠 std::variant 的闭合枚举性质 + std::visit 的静态穷举约束共同守住的。少一个 operator(),或多一个 std::get,边界就松动一次。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

970

2023.08.02

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

845

2023.08.22

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

558

2023.09.20

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

970

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

605

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

212

2025.08.29

javascriptvoid(o)怎么解决
javascriptvoid(o)怎么解决

javascriptvoid(o)的解决办法:1、检查语法错误;2、确保正确的执行环境;3、检查其他代码的冲突;4、使用事件委托;5、使用其他绑定方式;6、检查外部资源等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

186

2023.11.23

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 12.8万人学习

CSS3 教程
CSS3 教程

共18课时 | 6.7万人学习

Vue 教程
Vue 教程

共42课时 | 9.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号