0

0

使用JS实现一个简单的编译器_javascript高级

狼影

狼影

发布时间:2025-10-30 09:48:02

|

634人浏览过

|

来源于php中文网

原创

答案:该JavaScript编译器将Lisp风格函数调用转换为C风格,通过四步实现:词法分析将输入拆为词元;语法分析构建AST;转换器修改AST结构;代码生成器输出目标字符串。示例输入(add 2 (subtract 4 2))被正确转为add(2, subtract(4, 2)),展示了编译器核心流程:解析→转换→生成,帮助理解AST在Babel等工具中的作用。

使用js实现一个简单的编译器_javascript高级

要实现一个简单的 JavaScript 编译器,我们不需要从零造轮子,但可以借助 AST(抽象语法树)来理解编译过程的核心步骤:词法分析、语法分析、转换和代码生成。下面是一个极简的“编译器”,它将类似 Lisp 风格的函数调用转换为 C 语言风格的函数调用。

例如:

输入(Lisp 风格):

(add 2 (subtract 4 2))

立即学习Java免费学习笔记(深入)”;

输出(C 风格):

add(2, subtract(4, 2))

1. 词法分析(Tokenizer)

将输入字符串拆分为“词元”(tokens),比如括号、标识符、数字等。

AI Web Designer
AI Web Designer

AI网页设计师,快速生成个性化的网站设计

下载
function tokenizer(input) {
  let current = 0;
  const tokens = [];

  while (current < input.length) {
    let char = input[current];

    if (char === '(') {
      tokens.push({ type: 'paren', value: '(' });
      current++;
      continue;
    }

    if (char === ')') {
      tokens.push({ type: 'paren', value: ')' });
      current++;
      continue;
    }

    // 跳过空白字符
    if (/\s/.test(char)) {
      current++;
      continue;
    }

    // 匹配数字(支持多位)
    if (/[0-9]/.test(char)) {
      let value = '';
      while (/[0-9]/.test(char)) {
        value += char;
        char = input[++current];
      }
      tokens.push({ type: 'number', value });
      continue;
    }

    // 匹配字母(用于函数名如 add, subtract)
    if (/[a-z]/i.test(char)) {
      let value = '';
      while (/[a-z]/i.test(char)) {
        value += char;
        char = input[++current];
      }
      tokens.push({ type: 'name', value });
      continue;
    }

    throw new TypeError('未知字符: ' + char);
  }

  return tokens;
}

2. 语法分析(Parser)

将词元列表转换为抽象语法树(AST)。

function parser(tokens) {
  let current = 0;

  function walk() {
    let token = tokens[current];

    // 数字节点
    if (token.type === 'number') {
      current++;
      return {
        type: 'NumberLiteral',
        value: token.value,
      };
    }

    // 函数调用以左括号开始
    if (token.type === 'paren' && token.value === '(') {
      token = tokens[++current]; // 跳过 '('

      // 下一个是函数名
      let node = {
        type: 'CallExpression',
        name: token.value,
        params: [],
      };

      token = tokens[++current]; // 跳过函数名

      // 处理参数,直到遇到右括号
      while (token.type !== 'paren' || token.value !== ')') {
        node.params.push(walk());
        token = tokens[current];
      }

      current++; // 跳过 ')'
      return node;
    }

    throw new TypeError('意外的 token: ' + token.value);
  }

  // 构建根节点
  const ast = {
    type: 'Program',
    body: [],
  };

  while (current < tokens.length) {
    ast.body.push(walk());
  }

  return ast;
}

3. 转换(Transformer)

遍历 AST 并生成新的 AST 结构(目标结构)。

function transformer(ast) {
  const newAst = {
    type: 'Program',
    body: [],
  };

  ast._context = newAst.body;

  function traverse(node, parent) {
    if (node.type === 'NumberLiteral') {
      parent._context.push({
        type: 'NumberLiteral',
        value: node.value,
      });
    }

    if (node.type === 'CallExpression') {
      let expression = {
        type: 'CallExpression',
        callee: {
          type: 'Identifier',
          name: node.name,
        },
        arguments: [],
      };

      node._context = expression.arguments;
      parent._context.push(expression);
    }

    if (node.type === 'Program') {
      node.body.forEach(child => {
        traverse(child, node);
      });
    }

    if (node.type === 'CallExpression') {
      node.params.forEach(child => {
        traverse(child, node);
      });
    }
  }

  traverse(ast, null);
  return newAst;
}

4. 代码生成(Code Generator)

将新 AST 转换为目标代码字符串。

function codeGenerator(node) {
  if (node.type === 'Program') {
    return node.body.map(codeGenerator).join('\n');
  }

  if (node.type === 'Identifier') {
    return node.name;
  }

  if (node.type === 'NumberLiteral') {
    return node.value;
  }

  if (node.type === 'CallExpression') {
    const args = node.arguments.map(codeGenerator).join(', ');
    return `${codeGenerator(node.callee)}(${args})`;
  }

  throw new TypeError('未支持的节点类型: ' + node.type);
}

把所有部分组合起来:

function compiler(input) {
  const tokens = tokenizer(input);
  const ast = parser(tokens);
  const newAst = transformer(ast);
  const output = codeGenerator(newAst);
  return output;
}

测试一下:

const input = '(add 2 (subtract 4 2))';
console.log(compiler(input)); 
// 输出: add(2, subtract(4, 2))
</font>

基本上就这些。这个简单编译器展示了现代编译器(如 Babel、TypeScript)的基本流程:解析 → 转换 → 生成。虽然功能极简,但它帮助你理解 AST 的作用和编译原理的核心思想。不复杂但容易忽略细节,比如上下文管理和递归遍历。掌握这些,再看 babel 插件或自定义 DSL 就会清晰很多。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

49

2026.02.13

TypeScript全栈项目架构与接口规范设计
TypeScript全栈项目架构与接口规范设计

本专题面向全栈开发者,系统讲解基于 TypeScript 构建前后端统一技术栈的工程化实践。内容涵盖项目分层设计、接口协议规范、类型共享机制、错误码体系设计、接口自动化生成与文档维护方案。通过完整项目示例,帮助开发者构建结构清晰、类型安全、易维护的现代全栈应用架构。

196

2026.02.25

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

37

2026.03.13

mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

210

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

324

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

293

2025.06.11

c++标识符介绍
c++标识符介绍

本专题整合了c++标识符相关内容,阅读专题下面的文章了解更多详细内容。

178

2025.08.07

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Rust 教程
Rust 教程

共28课时 | 6.9万人学习

Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号