从零构建编程语言解释器：深入理解AST、环境与闭包实现

2026/6/26 4:38:25

1. 项目概述：从零开始构建自己的解释器

如果你对编程语言的工作原理感到好奇，想知道一段代码从文本字符变成计算机能执行的动作，背后究竟发生了什么，那么“Crafting Interpreters”（构建解释器）这个项目，或者说这个学习路径，就是为你量身定做的。它不是一个现成的软件，而是一个系统性的实践指南，核心目标就是引导你，亲手从零开始，用代码实现一个完整的编程语言解释器。

解释器是什么？简单来说，它就像一个实时翻译官。编译器（Compiler）是把整个程序（比如一个.c文件）一次性翻译成机器码，生成一个独立的可执行文件（如.exe）。而解释器（Interpreter）则是“读一行，翻译一行，执行一行”，像Python、JavaScript、Lua这些语言的运行环境，其核心就是一个解释器。通过构建解释器，你能深入到语言最核心的领域：词法分析、语法解析、语义分析、运行时环境、虚拟机。这不仅仅是“会用”一门语言，而是“理解”和“创造”一门语言。

这个项目适合谁？首先，它非常适合有一定编程基础（比如熟练掌握一门如Java、C++或Go这样的静态语言）并渴望突破天花板的开发者。其次，对于计算机科学的学生，这是将《编译原理》这门“天书”课程具象化的最佳实践。最后，对于任何有极客精神的程序员，亲手打造一个哪怕玩具级的语言，所带来的成就感和对编程范式的深刻理解，是阅读任何书籍都无法替代的。接下来，我将以一个虚构的、名为“Lox”的语言（这是《Crafting Interpreters》一书中的教学语言）为例，拆解构建一个树遍历解释器的全过程，分享其中的核心思路、实操细节和无数个我踩过的坑。

2. 整体设计与核心思路拆解

构建一个解释器，远不是写一个巨大的if-else链来匹配字符串那么简单。它需要一个清晰、分层的架构。主流的解释器实现有两种核心思路：树遍历解释器和字节码虚拟机。我们这里先聚焦于前者，因为它概念更直观，是理解后者的基石。

2.1 为什么选择树遍历解释器作为起点？

树遍历解释器，顾名思义，它的核心工作流程是：先将源代码文本解析成一棵抽象的语法树（Abstract Syntax Tree, AST），然后编写一个解释器，递归地遍历这棵树，在遍历的过程中执行相应的计算。选择它作为起点，有以下几个关键考量：

直观映射：AST的结构几乎就是代码语法结构的直接镜像。一个if语句在AST中就是一个IfStmt节点，它有condition、thenBranch、elseBranch三个子节点。解释器遍历时，看到这个节点，就知道该执行条件判断和分支跳转。这种“所见即所得”的映射关系，极大地降低了理解门槛。
关注点分离：整个流程被清晰地划分为“前端”（词法、语法分析，生成AST）和“后端”（解释执行AST）。你可以独立地、增量地实现它们。先让前端能正确解析1 + 2 * 3并生成正确的AST，再让后端去执行这个AST得到结果7。这种模块化让调试变得相对容易。
奠定基础：树遍历解释器中涉及的许多概念——如作用域、环境、函数调用栈——是任何语言实现的核心。在这里学透了，未来转向更高效的字节码虚拟机时，你只需要把“遍历AST执行”换成“遍历字节码指令执行”，核心的运行时模型是相通的。

注意：树遍历解释器的最大缺点是效率相对较低。每次执行都需要遍历整个AST，对于循环中的代码，会被反复解析和遍历。但这对于学习目的来说不是问题，清晰性优先于性能。

2.2 核心组件与数据流

一个完整的树遍历解释器，其内部数据流和核心组件可以概括为以下几步，这构成了我们实现的基本蓝图：

源代码：用户编写的文本，例如var a = “hello”; print a;。
扫描器（Scanner / Lexer）：负责词法分析。它将字符流（源代码）切割成一个个有意义的“单词”，称为词法单元（Token）。例如，上述代码会被切割成：[VAR, IDENTIFIER(“a”), EQUAL, STRING(“hello”), SEMICOLON, PRINT, IDENTIFIER(“a”), SEMICOLON]。这个过程会忽略空格和注释。
解析器（Parser）：负责语法分析。它接收Token流，根据预定义的语法规则（通常用上下文无关文法描述），将其组装成一棵抽象语法树（AST）。这棵树代表了程序的语法结构，但不关心具体如何执行。
解释器（Interpreter）：这是后端核心。它接收AST，进行语义分析（如变量是否已声明？类型是否匹配？），并递归地遍历AST节点，执行相应的操作。它需要维护一个环境（Environment）来存储和查找变量，以及一个机制来处理函数调用和控制流。

整个流程就像一条生产线：源代码是原料，扫描器是切割机，解析器是组装车间，解释器是总装和测试车间，最终产出运行结果。

3. 核心细节解析与实操要点

理解了宏观架构，我们深入到每个组件的魔鬼细节中。这里藏着无数让初学者崩溃的“坑”。

3.1 扫描器：从字符到Token的精确切割

扫描器看似简单，就是读字符、分类，但细节决定成败。

核心任务：实现一个确定有限状态自动机（DFA）。简单说，就是根据当前读到的字符，决定下一个状态。读到一个字母，进入“标识符或关键字”状态；读到一个数字，进入“数字字面量”状态；读到引号，进入“字符串字面量”状态。

实操要点与避坑指南：

关键字识别：不要写一长串if (lexeme == “var”) … else if …。最佳实践是：先将标识符词素（lexeme）完整读出来，然后在一个哈希表（如Map<String, TokenType>）中查找它是否是预定义的关键字。这样代码更简洁，且易于扩展新关键字。
数字解析：读入“123.45”时，要小心处理小数点。常见错误是读到.就立刻结束数字扫描，但.后面可能还有数字（123.是无效的，123.45才是有效的）。正确的状态是：遇到数字后，持续读入数字；遇到第一个.，检查下一个字符是否是数字，如果是，则进入“小数部分”状态继续读。
字符串处理：必须处理转义字符，如\n,\t,\”。当在字符串状态中读到反斜杠\时，需要查看下一个字符，并将其映射到真正的控制字符或字符本身。切记：字符串词素中不应包含首尾的引号。
错误报告：扫描器是第一个接触用户代码的组件，错误信息要友好。不仅要报告“第几行有非法字符”，最好能指出是哪个字符，并给出上下文。例如：Error at line 3: Unexpected character ‘@’ in identifier.

// 扫描器核心循环的简化伪代码 while (!isAtEnd()) { start = current; char c = advance(); switch (c) { case ‘(‘: addToken(LEFT_PAREN); break; case ‘+‘: addToken(PLUS); break; case ‘“‘: handleString(); break; // 进入字符串处理函数 default: if (isDigit(c)) { handleNumber(); } else if (isAlpha(c)) { handleIdentifier(); // 这里会识别关键字或普通标识符 } else { error(line, “Unexpected character.”); } } }

3.2 解析器：从Token流到语法树的魔法

解析器是前端最复杂的部分，它要将线性的Token流，根据语法规则，构建成树形的结构。我们通常使用递归下降解析法，因为它直观，且与语法规则几乎一一对应。

核心思想：为语法中的每一条规则（如expression,term,factor）编写一个对应的函数。这些函数会“消费”（consume）Token，并返回一个AST节点。

语法规则示例（表达式部分）：

expression → equality ; equality → comparison ( ( “!=” | “==” ) comparison )* ; comparison → term ( ( “>” | “>=” | “<” | “<=” ) term )* ; term → factor ( ( “-” | “+” ) factor )* ; factor → unary ( ( “/” | “*” ) unary )* ; unary → ( “!” | “-” ) unary | primary ; primary → NUMBER | STRING | “true” | “false” | “nil” | “(” expression “)” ;

*表示0次或多次重复，|表示或。

实操要点与避坑指南：

左递归陷阱：如果你写的规则是expression → expression “+” term，并在parseExpression()函数中直接递归调用自身，会导致无限递归，栈溢出。必须消除左递归，将其改写为expression → term ( “+” term )*的形式。上面的规则已经做了这个处理。
优先级和结合性：优先级通过规则嵌套实现。在上面的规则中，primary优先级最高，unary次之，然后是factor（乘除），term（加减），comparison（比较），equality（等值）。expression是入口。结合性通过循环( … )*来实现左结合。例如1 + 2 + 3会被解析为((1 + 2) + 3)。
错误恢复：解析器遇到语法错误时（比如缺少右括号），不能直接崩溃退出。需要实现一种“同步恢复”机制，比如在遇到分号;或声明语句的开头（如var,for）时，认为一个语句结束，可以丢弃一些Token，尝试继续解析后面的代码。这能提高用户体验，一次报告多个错误。
AST节点设计：AST节点类要设计得清晰。通常有一个基类Expr（表达式）或Stmt（语句），然后派生出各种具体节点，如BinaryExpr（二元运算，有左操作数、运算符、右操作数三个字段）、LiteralExpr（字面量，存储值）、VarExpr（变量，存储变量名）等。使用访问者模式（Visitor Pattern）可以优雅地分离AST结构和遍历操作，但初期为了简单，也可以在节点基类里放一个抽象的evaluate()方法。

// 解析 “factor” 规则的简化伪代码 private Expr factor() { Expr expr = unary(); // 先解析更高优先级的 unary while (match(SLASH, STAR)) { // 循环处理连续的 * 或 / Token operator = previous(); Expr right = unary(); expr = new BinaryExpr(expr, operator, right); // 构建左结合的AST } return expr; }

4. 实操过程与核心环节实现

当前端生成了正确的AST，最激动人心的部分——让程序“跑”起来——就开始了。解释器的核心是求值（Evaluate）和执行（Execute）。

4.1 环境：变量的记忆宫殿

解释器需要一个地方来记住变量名和它的值之间的映射关系，这就是环境（Environment）。本质上，它是一个链式的字典（哈希表）。

实现：一个Environment类，内部有一个Map<String, Object> values用于存储本层的变量绑定，以及一个可选的Environment enclosing指向外层（父级）环境。这形成了作用域链。
变量解析：当需要获取变量a的值时，解释器首先在当前环境的values中查找。如果没找到，就通过enclosing指针去外层环境找，直到全局环境（enclosing为null）。如果全程找不到，则报“未定义变量”错误。
变量赋值：赋值a = 5;时，同样沿着作用域链查找名为a的变量。关键点：它修改的是已存在的绑定，而不是创建一个新的。如果在当前作用域没找到，它不会在当前作用域新建，而是继续向外层查找。只有var a = 5;（声明）才会在当前作用域创建新的绑定。

public class Environment { final Environment enclosing; private final Map<String, Object> values = new HashMap<>(); Object get(Token name) { if (values.containsKey(name.lexeme)) { return values.get(name.lexeme); } // 向父级环境查找 if (enclosing != null) return enclosing.get(name); // 全局都找不到，报错 throw new RuntimeError(name, “Undefined variable ‘“ + name.lexeme + “‘.”); } void assign(Token name, Object value) { if (values.containsKey(name.lexeme)) { values.put(name.lexeme, value); return; } // 向父级环境查找并赋值 if (enclosing != null) { enclosing.assign(name, value); return; } throw new RuntimeError(name, “Undefined variable ‘“ + name.lexeme + “‘.”); } void define(String name, Object value) { values.put(name, value); // 声明，总是在当前环境创建 } }

4.2 解释执行：遍历AST并求值

解释器实现一个evaluate(Expr expr)方法，它根据不同的AST节点类型进行分发处理。这是树遍历的核心。

字面量：直接返回存储的值。evaluate(new LiteralExpr(123))返回123。
二元运算：先递归求值左表达式leftValue，再求值右表达式rightValue，然后检查操作符op，执行对应计算。这里有一个巨大陷阱：必须严格检查操作数的类型。“hello” + “world”是连接，1 + 2是加法，但“hello” + 123或true + false呢？你的语言需要定义明确的规则。通常，动态类型语言会进行隐式转换（如数字转字符串），但为了严谨和学习，我建议在初期不做任何隐式转换，类型不匹配直接报错。这能让你更清晰地理解类型系统。
变量表达式：调用环境的get方法，返回变量名对应的值。
赋值表达式：先求值右表达式得到值，然后调用环境的assign方法更新变量绑定，最后返回这个值（这样赋值表达式本身也有值，可以连续赋值a = b = 5）。
逻辑运算（and, or）的短路求值：这是关键优化和语义要求。对于left and right，必须先求值left，如果为假（在Lox中，nil和false是假，其他都是真），则直接返回left的值，不再求值right。or运算同理。这必须在解释器逻辑中显式实现，而不是简单地当作普通的二元运算。

// 解释二元表达式的简化伪代码 @Override public Object visitBinaryExpr(Expr.Binary expr) { Object left = evaluate(expr.left); Object right = evaluate(expr.right); switch (expr.operator.type) { case PLUS: // 类型检查！ if (left instanceof Double && right instanceof Double) { return (double)left + (double)right; } if (left instanceof String && right instanceof String) { return (String)left + (String)right; } // 甚至可以支持字符串和数字拼接（根据语言设计） // if (left instanceof String) return (String)left + stringify(right); // if (right instanceof String) return stringify(left) + (String)right; throw new RuntimeError(expr.operator, “Operands must be two numbers or two strings.”); case MINUS: checkNumberOperands(expr.operator, left, right); // 辅助函数，检查是否为数字 return (double)left - (double)right; // … 处理其他运算符 } return null; }

4.3 控制流与语句执行

表达式产生值，语句产生“效果”。解释器还需要一个execute(Stmt stmt)方法来处理语句。

表达式语句：求值其中的表达式，然后丢弃结果（除非是REPL环境）。
打印语句：求值表达式，调用一个stringify()函数将值转换为可读字符串，然后输出到控制台。
变量声明语句：在当前环境中，将变量名和初始值（如果提供了）或nil进行绑定。
块语句：创建一个新的嵌套环境（其enclosing指向当前环境），然后在这个新环境中执行块内的所有语句。块执行完毕后，解释器需要“回退”到外层环境。这完美实现了词法作用域。
条件语句（if）：先求值条件表达式。根据其真假值，决定执行thenBranch还是可选的elseBranch。
循环语句（while）：在一个循环中，反复求值条件。只要为真，就执行循环体。这里需要小心实现break和continue（如果支持的话），通常通过异常或一个特殊的控制流标志来实现。

5. 函数与闭包：从静态到动态的飞跃

为语言添加函数，是将其从计算器提升为真正编程语言的关键一步。这引入了“可调用对象”和更复杂的环境管理。

5.1 函数作为一等公民

在我们的语言中，函数应该是一等公民：可以赋值给变量、作为参数传递、作为返回值。因此，我们需要一个运行时对象来表示函数。我将其称为LoxFunction。

LoxFunction对象：它需要存储函数的声明节点（包含参数列表、函数体）和创建该函数时所在的环境（这是实现闭包的关键！）。
调用（Call）：当解释器遇到一个函数调用表达式（如add(1, 2)）时，它会：
1. 求值“callee”（通常是标识符add，得到一个LoxFunction对象）。
2. 按顺序求值所有参数表达式。
3. 为这次调用创建一个新的环境，其enclosing指向函数对象存储的创建时环境（闭包环境），而不是调用时的环境！这是最易错点。
4. 在这个新环境中，将形参名与实参值绑定起来。
5. 在这个新环境中执行函数体。
6. 如果遇到return语句，捕获返回值并结束执行；如果执行到函数体末尾，则返回nil。

5.2 闭包：捕获自由变量

闭包是函数和其引用到的非局部变量（自由变量）的组合。正是由于LoxFunction对象保存了其定义时的环境，才使得闭包成为可能。

经典例子：

function makeCounter() { var i = 0; function count() { i = i + 1; print i; } return count; } var counter = makeCounter(); counter(); // 打印 1 counter(); // 打印 2

当makeCounter()执行时，创建了局部变量i和内部函数count。count函数被返回并赋值给全局变量counter。此时，makeCounter的执行环境本应被销毁，但因为count函数对象引用了这个环境（其中包含变量i），所以这个环境不会被垃圾回收。后续每次调用counter()，它操作的都是那个被“封闭”起来的、独一无二的i。这就是闭包。

实现关键：在executeBlock()（执行块语句或函数体）时，传入的environment参数必须是函数创建时捕获的环境，而不是一个全新的全局环境或当前环境。

6. 面向对象与类的实现

为解释器添加简单的基于类的面向对象支持，能让你理解this、初始化器、方法等概念是如何在运行时运作的。

6.1 类与实例

类（LoxClass）：也是一个运行时对象。它存储类名、方法表（方法名到LoxFunction的映射）。类本身也可以被调用（如var p = Point(2, 3);），这触发了实例化过程。
实例（LoxInstance）：每个实例内部有一个字典，存储自身的字段（属性）。同时，它持有对其类的引用。
实例化：调用类时，解释器创建一个新的LoxInstance，然后查找该类中名为init的特殊方法（构造器）。如果找到，就调用这个init方法（将this绑定为该新实例）进行初始化。
属性访问：instance.property，首先在实例自身的字段字典中查找，如果没找到，则去其类的方法表中查找。这实现了字段覆盖方法？不，通常字段和方法是分开的命名空间，但为了简单，我们可以设计为字段优先。
this关键字：在方法内部，this是一个特殊的变量，它被绑定到调用该方法的实例对象。这需要在方法调用时，动态地将该方法所处的环境的外层环境（enclosing）设置为一个包含this绑定的新环境。

6.2 继承

实现单继承会引入更多复杂性。

超类（superclass）：LoxClass需要增加一个superclass字段。
方法查找：当在实例上调用方法时，如果当前类中没找到，需要递归地在其超类链中查找。
super关键字：用于在子类方法中调用超类方法。super不是一个指向超类实例的this，而是一个指向超类的引用，用于进行方法查找的起点。实现时，需要知道当前方法在哪个类中（通过环境链或其它方式），然后从该类的超类开始查找方法。

7. 常见问题与排查技巧实录

在构建解释器的过程中，我遇到了无数诡异的问题。下面这个表格记录了一些最典型的问题及其排查思路：

问题现象	可能原因	排查与解决思路
解析`1 + 2 * 3`得到`9`(即`(1+2)*3`)	运算符优先级处理错误。解析器将`+`和`*`放在了同一优先级，或结合性错误。	回顾语法规则，确保乘除(`factor`)规则比加减(`term`)规则优先级更高（嵌套更深）。使用打印AST的功能，可视化查看生成的树结构是否正确。
变量在块内赋值后，块外访问不到修改。	作用域实现错误。可能为每个块创建了新环境，但赋值操作错误地写到了外层环境。	检查`Environment.assign()`方法。它必须沿着作用域链查找变量，而不是只在当前环境创建新绑定。确保`executeBlock()`在结束后正确恢复了之前的环境。
函数递归调用导致栈溢出（即使逻辑正确）。	递归深度过大，或函数调用环境管理有误，导致环境引用形成环，无法释放。	首先确认是否是合法的深度递归（如计算超大斐波那契数）。如果是，语言本身可能需考虑尾调用优化。否则，检查函数调用时创建的新环境，其`enclosing`是否指向了函数定义时的环境，而不是调用时的环境或自身，避免循环引用。
闭包行为异常，每次调用都访问同一个变量。	所有闭包共享了同一个环境，而不是各自捕获定义时的环境快照。	这是最经典的错误。确保每个`LoxFunction`对象在创建时，都保存了当时的环境的一个引用（或拷贝）。在调用时，以这个保存的环境作为父环境来创建新的调用环境。
`this`在嵌套函数中指向错误。	`this`的绑定在环境链中传递错误。在嵌套函数被调用时，其环境链中丢失了外层的`this`绑定。	实现方法调用时，不仅要绑定`this`到方法所属的实例，还要确保这个绑定被放在一个独立的环境中，并且这个环境是方法函数定义时所捕获环境（闭包环境）的父环境。这样，嵌套函数才能通过作用域链找到正确的`this`。
报错信息行号不准，或指向莫名其妙的位置。	Token中记录的行号（或列号）在扫描或解析过程中更新有误。	在扫描器中，每次遇到换行符`\n`时，必须递增行号计数器，并将列号重置。确保每个Token都正确记录了它起始位置的行列号。在解析器和解释器中传递Token用于报错。

调试心得：

AST可视化是神器：实现一个将AST打印成缩进树状文本或生成Dot语言图形的功能。当解析结果不符合预期时，看一眼AST就一目了然。
分阶段测试，从小处着手：不要等全部写完再测试。先让扫描器能正确识别所有Token，写一堆测试用例。然后让解析器能解析1 + 2并生成正确AST。接着让解释器能对这个AST求值得到3。每一步都稳扎稳打。
善用单元测试：为扫描器、解析器、解释器的各个组件编写单元测试。特别是对于边缘情况，如浮点数、字符串转义、注释嵌套、复杂的运算符组合等。
手动跟踪执行流程：对于复杂的逻辑（如闭包、this绑定），在关键点打印日志，手动在纸上画出环境的父子关系图，跟踪变量的查找路径。这是理解运行时动态的最有效方法。

构建一个解释器的旅程，就像在代码的世界里从零开始搭建一座运转精密的钟表。每一个齿轮（组件）都必须严丝合缝。这个过程会极大地深化你对编程语言、数据结构、算法乃至软件设计的理解。当你第一次用自己创造的语言写出一个递归函数来计算阶乘，并看到它正确运行时，那种纯粹的创造快乐是无与伦比的。这不仅仅是实现了一个项目，更是获得了一种“语言”的透视能力，从此再看任何编程语言，你都能隐约看到其解释器或编译器在幕后忙碌的身影。