0

0

C++如何实现一个简单的AST_使用C++构建抽象语法树并进行代码解析

下次还敢

下次还敢

发布时间:2025-11-30 03:03:12

|

1064人浏览过

|

来源于php中文网

原创

答案:文章介绍了在C++中构建简单抽象语法树(AST)的过程,涵盖节点基类定义、具体节点类型实现、变量环境管理、词法分析器与递归下降解析器的设计,并通过示例展示表达式解析与求值流程。

c++如何实现一个简单的ast_使用c++构建抽象语法树并进行代码解析

在C++中实现一个简单的抽象语法树(AST)是理解编译器或解释器工作原理的关键一步。AST 是源代码结构的树形表示,它忽略掉源码中的语法细节(如括号、分号),专注于程序的逻辑结构。下面我们将一步步构建一个极简的 AST,并结合词法分析和语法分析来解析简单表达式。

1. 定义AST节点基类

所有AST节点都应继承自一个公共基类。我们使用多态来处理不同类型的节点,比如数字、变量、二元操作等。

#include <memory>
#include <string>
#include <map>
#include <iostream>
<p>// 所有AST节点的基类
struct ExprAST {
virtual ~ExprAST() = default;
virtual double evaluate() const = 0; // 解释执行接口
};</p>

2. 实现具体节点类型

根据常见表达式元素,定义几种基本节点:

  • 字节:表示常量值
  • 二元操作节点:如加减乘除
  • 变量节点:表示标识符
  • 赋值节点:将值绑定到变量

立即学习C++免费学习笔记(深入)”;

// 数字常量节点
struct NumberExprAST : ExprAST {
    double val;
    explicit NumberExprAST(double v) : val(v) {}
    double evaluate() const override { return val; }
};
<p>// 变量节点
struct VariableExprAST : ExprAST {
std::string name;
explicit VariableExprAST(const std::string &n) : name(n) {}
double evaluate() const override;
};</p><p>// 二元操作节点(+、-、*、/)
struct BinaryExprAST : ExprAST {
char op;
std::unique_ptr<ExprAST> lhs, rhs;</p><pre class='brush:php;toolbar:false;'>BinaryExprAST(char o, std::unique_ptr<ExprAST> l, std::unique_ptr<ExprAST> r)
    : op(o), lhs(std::move(l)), rhs(std::move(r)) {}

double evaluate() const override;

};

// 赋值节点 struct AssignmentExprAST : ExprAST { std::string varName; std::unique_ptr<ExprAST> expr;

AssignmentExprAST(const std::string &name, std::unique_ptr<ExprAST> e)
    : varName(name), expr(std::move(e)) {}

double evaluate() const override;

};

这些节点通过重写 evaluate 方法实现求值逻辑。变量和赋值需要访问一个全局变量环境。

3. 添加变量环境支持

我们需要一个地方存储变量值。使用一个简单的 map 即可。

static std::map<std::string, double> variableValues;
<p>double VariableExprAST::evaluate() const {
auto it = variableValues.find(name);
if (it != variableValues.end()) return it->second;
return 0.0; // 未定义变量默认为0
}</p><p>double AssignmentExprAST::evaluate() const {
double val = expr->evaluate();
variableValues[varName] = val;
return val;
}</p>

4. 简单的词法分析器(Tokenizer)

将输入字符串拆分为 token 流。这里只处理数字、字母、操作符和空格。

class Lexer {
    std::string input;
    size_t pos = 0;
<p>public:
explicit Lexer(const std::string &src) : input(src) {}</p><pre class='brush:php;toolbar:false;'>int getNextToken() {
    while (pos < input.size() && isspace(input[pos]))
        pos++;

    if (pos >= input.size()) return 0; // EOF

    if (isdigit(input[pos]) || input[pos] == '.') {
        std::string numStr;
        while (pos < input.size() && (isdigit(input[pos]) || input[pos] == '.'))
            numStr += input[pos++];
        lastNum = stod(numStr);
        return 'n'; // number token
    }

    if (isalpha(input[pos])) {
        std::string name;
        while (pos < input.size() && isalnum(input[pos]))
            name += input[pos++];
        lastIdentifier = name;
        return 'v'; // variable or identifier
    }

    if (input[pos] == '=') {
        pos++;
        return '='; // assignment
    }

    return input[pos++]; // operator or punctuation
}

double lastNum;
std::string lastIdentifier;

};

5. 递归下降解析器

实现一个简单的递归下降解析器来构建AST。我们支持如下文法:

歌者PPT
歌者PPT

歌者PPT,AI 写 PPT 永久免费

下载
  • 表达式 → 赋值表达式
  • 赋值表达式 → 标识符 '=' 表达式 | 加减表达式
  • 加减表达式 → 乘除表达式的序列(用 + 或 - 连接)
  • 乘除表达式 → 原子表达式的序列(用 * 或 / 连接)
  • 原子表达式 → 数字 | 变量 | (表达式)

立即学习C++免费学习笔记(深入)”;

class Parser {
    Lexer lexer;
    int currentToken;
<pre class='brush:php;toolbar:false;'>void advance() { currentToken = lexer.getNextToken(); }

std::unique_ptr<ExprAST> parsePrimary();
std::unique_ptr<ExprAST> parseExpression();
std::unique_ptr<ExprAST> parseBinOpRHS(int precedence, std::unique_ptr<ExprAST> lhs);
std::unique_ptr<ExprAST> parseAssignment();

public: explicit Parser(const std::string &src) : lexer(src) { advance(); // 初始化第一个token }

std::unique_ptr<ExprAST> parse();

};

std::unique_ptr<ExprAST> Parser::parse() { if (currentToken == 0) return nullptr; return parseAssignment(); }

std::unique_ptr<ExprAST> Parser::parseAssignment() { if (currentToken == 'v') { std::string idName = lexer.lastIdentifier; advance(); if (currentToken == '=') { advance(); auto expr = parseExpression(); if (!expr) return nullptr; return std::make_unique<AssignmentExprAST>(idName, std::move(expr)); } // 不是赋值,则回退为普通变量使用 return std::make_unique<VariableExprAST>(idName); } return parseExpression(); }

// 支持优先级的二元表达式解析 std::unique_ptr<ExprAST> Parser::parseExpression() { auto lhs = parsePrimary(); if (!lhs) return nullptr; return parseBinOpRHS(0, std::move(lhs)); }

int getOperatorPrecedence(char op) { switch (op) { case '+': case '-': return 1; case '*': case '/': return 2; default: return -1; } }

std::unique_ptr<ExprAST> Parser::parseBinOpRHS(int precedence, std::unique_ptr<ExprAST> lhs) { while (true) { int prec = getOperatorPrecedence(currentToken); if (prec < precedence) return lhs;

    char op = currentToken;
    advance();

    auto rhs = parsePrimary();
    if (!rhs) return nullptr;

    int nextPrec = getOperatorPrecedence(currentToken);
    if (nextPrec > prec) {
        rhs = parseBinOpRHS(prec + 1, std::move(rhs));
        if (!rhs) return nullptr;
    }

    lhs = std::make_unique<BinaryExprAST>(op, std::move(lhs), std::move(rhs));
}

}

std::unique_ptr<ExprAST> Parser::parsePrimary() { switch (currentToken) { case 'n': { auto result = std::make_unique<NumberExprAST>(lexer.lastNum); advance(); return result; } case 'v': { auto result = std::make_unique<VariableExprAST>(lexer.lastIdentifier); advance(); return result; } case '(': { advance(); // consume '(' auto expr = parseExpression(); if (currentToken != ')') { std::cerr << "Expected ')'\n"; return nullptr; } advance(); // consume ')' return expr; } default: std::cerr << "Unexpected token: " << char(currentToken) << "\n"; return nullptr; } }

// 二元操作求值实现 double BinaryExprAST::evaluate() const { double L = lhs->evaluate(); double R = rhs->evaluate(); switch (op) { case '+': return L + R; case '-': return L - R; case '': return L R; case '/': return L / R; default: return 0.0; } }

6. 使用示例

现在我们可以测试整个流程:

int main() {
    std::string input;
    std::cout << "Enter expression (e.g., a=3+4*2): ";
    std::getline(std::cin, input);
<pre class='brush:php;toolbar:false;'>Parser parser(input);
auto ast = parser.parse();

if (ast) {
    double result = ast->evaluate();
    std::cout << "Result: " << result << "\n";
    std::cout << "Variables:\n";
    for (const auto& [name, val] : variableValues) {
        std::cout << "  " << name << " = " << val << "\n";
    }
} else {
    std::cerr << "Parse error.\n";
}

return 0;

}

运行示例:

输入:a=3+4*2
输出:Result: 11
      Variables: a = 11

这个例子展示了如何从零开始构建一个可运行的 AST 系统。虽然功能简单,但它具备了真实编译器前端的核心组件:词法分析、语法分析、AST 构建与解释执行。

基本上就这些。你可以在此基础上扩展函数定义、控制流语句(if、while)、作用域管理等功能,逐步演化成一个完整的解释型语言前端。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1031

2023.08.02

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1567

2023.10.24

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

switch语句用法
switch语句用法

switch语句用法:1、Switch语句只能用于整数类型,枚举类型和String类型,不能用于浮点数类型和布尔类型;2、每个case语句后面必须跟着一个break语句,以防止执行其他case的代码块,没有break语句,将会继续执行下一个case的代码块;3、可以在一个case语句中匹配多个值,使用逗号分隔;4、Switch语句中的default代码块是可选的等等。

569

2023.09.21

Java switch的用法
Java switch的用法

Java中的switch语句用于根据不同的条件执行不同的代码块。想了解更多switch的相关内容,可以阅读本专题下面的文章。

441

2024.03.13

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

107

2023.09.25

java多态详细介绍
java多态详细介绍

本专题整合了java多态相关内容,阅读专题下面的文章了解更多详细内容。

27

2025.11.27

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6629

2023.09.14

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 11.3万人学习

C 教程
C 教程

共75课时 | 5.4万人学习

C++教程
C++教程

共115课时 | 21.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号