适合存入 std::variant 的 ast 节点类型是值语义、可拷贝、无虚函数的独立 struct(如 binaryop、intliteral、identifier),字段全用值类型,且需默认构造;必须用 std::visit 配合显式重载访问者类保障穷举安全,禁用 std::get 和裸指针。

std::variant 里存什么类型才适合做 AST 节点?
AST 节点必须是值语义、可拷贝、无虚函数——否则 std::variant 编译失败或运行时崩溃。常见错误是往里面塞 std::unique_ptr<basenode></basenode> 或带虚析构的基类指针,这会让 std::variant 的拷贝/移动语义失效。
正确做法是把每种节点定义为独立的 struct,字段全用值类型(std::string、int、std::vector),再统一放进 std::variant:
struct BinaryOp { std::string op; Expr lhs; Expr rhs; };
struct IntLiteral { int value; };
struct Identifier { std::string name; };
using Expr = std::variant<BinaryOp, IntLiteral, Identifier>;-
Expr必须能默认构造(否则std::variant初始化失败),所以每个成员 struct 都要有默认构造函数或聚合初始化支持 - 避免在节点里存裸指针或
std::shared_ptr—— 它们会让访问逻辑变重,且破坏栈语义 - 如果节点需要递归嵌套(比如
BinaryOp::lhs是另一个Expr),确保Expr在定义完成前已声明(用using提前声明 + 后置定义)
std::visit 怎么写访问者才能不漏分支、不崩掉?
直接传 lambda 给 std::visit 很容易漏处理某个 std::variant 的备选项,编译器不报错,但运行时抛 std::bad_variant_access。根本原因是 lambda 没覆盖所有类型,而 std::visit 的重载解析是静态的,不强制穷举。
可靠做法是写一个显式的访问者类,继承 std::variant::visitor 并用 auto operator() 重载全部可能类型:
立即学习“前端免费学习笔记(深入)”;
struct ExprPrinter {
void operator()(const BinaryOp& e) { /* ... */ }
void operator()(const IntLiteral& e) { /* ... */ }
void operator()(const Identifier& e) { /* ... */ }
};
std::visit(ExprPrinter{}, expr);- 少写一个
operator(),编译就报错(C++17 起),比 lambda 安全得多 - 不要用
auto模板参数捕获所有类型(template<typename t> void operator()(const T&)</typename>),它会吞掉所有类型,掩盖漏处理问题 - 如果访问者要带状态(比如缩进计数器),用成员变量而非捕获,否则跨线程或递归访问时行为不可控
为什么不能直接用 std::get(v) 做类型分发?
std::get<t>(v)</t> 在类型不匹配时抛异常,不是编译期检查。在解析器这种高频路径上,靠异常做控制流等于主动引入性能雷区,而且掩盖了“本该静态确定”的类型逻辑。
更严重的是:一旦 std::variant 新增一种节点类型,所有用 std::get 的地方都得手动加 try/catch 或重复判断,极易遗漏。
- 用
std::holds_alternative<t>(v)</t>+std::get<t></t>组合虽能避免异常,但仍是运行时分支,且代码冗长 -
std::visit是唯一能静态保证穷举、零开销抽象的方案——编译器生成的就是跳转表或 if-else 链,没虚调用也没异常开销 - 某些旧编译器(如 GCC 7.5 之前)对
std::visit的 SFINAE 支持不全,遇到模板访问者可能静默失败;建议锁死 GCC 8+ / Clang 6+
访问者返回值怎么统一又不失类型信息?
解析器常需从不同节点生成不同类型的中间结果(比如 BinaryOp 返回 IR::BinaryInst*,IntLiteral 返回 IR::Constant*),但 std::visit 要求所有重载返回同一类型。
解法是用 std::variant 套一层返回值,或者用 std::optional<t></t> + 断言,但最实用的是让访问者返回一个通用句柄(如 std::shared_ptr<:value></:value>),再在各 operator() 里做具体构造:
struct CodeGenVisitor {
std::shared_ptr<IR::Value> operator()(const BinaryOp& e) {
return std::make_shared<IR::BinaryInst>(e.op, ...);
}
std::shared_ptr<IR::Value> operator()(const IntLiteral& e) {
return std::make_shared<IR::Constant>(e.value);
}
};- 别用
void返回值然后靠成员变量攒结果——多层嵌套访问时状态混乱,线程不安全 - 如果 IR 层本身也是
std::variant,注意避免返回值嵌套过深(如std::variant<:variant>></:variant>),会拖慢编译和 debug 体验 - 返回智能指针时,确保底层 IR 类型没有循环引用,否则 GC 或析构会卡住
类型安全不是靠运行时检查堆出来的,而是靠 std::variant 的闭合枚举性质 + std::visit 的静态穷举约束共同守住的。少一个 operator(),或多一个 std::get,边界就松动一次。









