通过解析过程了解JavaScript

2023年3月31日 122次阅读

转载
原文地址：http://www.html5jscss.com/js-data-scope.html

什么是Javascript解析引擎？

Javascript解析引擎（简称Javascript引擎），是一个程序，是浏览器引擎的一个部分。

每个浏览器的Javascript解析引擎都不相同（因为每个浏览器编写Javascript解析引擎的语言（C或者C++）以及解析原理都不相同）。标准的Javascript解析引擎会按照 ECMAScript文档来实现。虽然每个浏览器的Javascript解析引擎不同，但Javascript的语言性质决定了Javascript关键的渲染原理仍然是动态执行Javascript字符串。只是词法分析、语法分析、变量赋值、字符串拼接的实现方式有所不同。

JavaScript解析引擎到底是干什么的？

JavaScript解析引擎就是根据ECMAScript定义的语言标准来动态执行JavaScript字符串。虽然之前说现在很多浏览器不全是按照标准来的，解释机制也不尽相同，但动态解析JS的过程还是分成两个阶段：语法检查阶段和运行阶段。

语法检查包括词法分析和语法分析，运行阶段又包括预解析和运行阶段（像V8引擎会将JavaScript字符串编译成二进制代码，此过程应该归到语法检查过程中）。

JavaScript解析过程

在JavaScript解析过程中，如遇错误就直接跳出当前代码块，直接执行下一个 script 代码段。所以在同一个 script 内的代码段有错误的话就不会执行下去，但是不会影响下一个 script 内的代码段。

第一阶段：语法检查

语法检查也是JavaScript解析器的工作之一，包括词法分析和语法分析，过程大致如下：

一：词法分析

词法分析：JavaScript解释器先把JavaScript代码（字符串）的字符流按照ECMAScript标准转换为记号流。
例如：把字符流：

a = (b - c);

转换为记号流：

NAME "a"
EQUALS
OPEN_PARENTHESIS
 NAME "b"
MINUS 
NAME "c"
CLOSE_PARENTHESIS
SEMICOLON

二：语法分析

语法分析：JavaScript语法分析器在经过词法分析后，将记号流按照ECMAScript标准把词法分析所产生的记号生成语法树。
通俗地说就是把从程序中收集的信息存储到数据结构中，每取一个词法记号，就送入语法分析器进行分析。

语法分析不做的事：去掉注释，自动生成文档，提供错误位置（可以通过记录行号来提供）。ECMAScript标准如下：

var，if，else，break，continue等是JavaScript的关键词
abstract，int，long等是JavaScript保留词
怎么样算是数字、怎么样算是字符串等等
定义了操作符（+，-，=）等操作符
定义了JavaScript的语法
定义了对表达式，语句等标准的处理算法，比如遇到==该如何处理
……

当语法检查正确无误之后，就可以进入运行阶段了。

第二阶段：运行阶段

一：预解析

第一步：JavaScript引擎将语法检查正确后生成的语法树复制到当前执行上下文中。
第二步：JavaScript引擎会对语法树当中的变量声明、函数声明以及函数的形参进行属性填充。

“预解析”从语法检查阶段复制过来的信息如下：

内部变量表varDecls：varDecls保存的用var进行显式声明的局部变量。
内嵌函数表funDecls：在“预解析”阶段，发现有函数定义的时候，除了记录函数的声明外，还会创建一个原型链对象（prototype）。
…其他的信息。

执行上下文（execution context）

（一）预解析阶段创建的执行上下文包括：变量对象、作用域链、this

变量对象（Variable Object）：由var declaration、function declaration（变量声明、函数声明）、arguments（参数）构成。变量对象是以单例形式存在。
作用域链（Scope Chain）：variable object + all parent scopes（变量对象以及所有父级作用域）构成。
this值：（thisValue）：content object。this值在进入上下文阶段就确定了。一旦进入执行代码阶段，this值就不会变了。

（二）“预解析”阶段创建执行上下文之后，还会对变量对象/活动对象（VO/AO）的一些属性填充数值。

函数的形参：执行上下文的变量对象的一个属性，其属性名就是形参的名字，其值就是实参的值；对于没有传递的参数，其值为undefined。
函数声明：执行上下文的变量对象的一个属性，属性名和值都是函数对象创建出来的；如果变量对象已经包含了相同名字的属性，则会替换它的值。
变量声明：执行上下文的变量对象的一个属性，其属性名即为变量名，其值为undefined；如果变量名和已经声明的函数名或者函数的参数名相同，则不会影响已经存在的函数声明的属性，该声明会被忽略掉，但其包含的赋值操作不会忽略。

变量对象/活动对象（VO/AO）填充的顺序也是按照以上顺序：函数的形参->函数声明->变量声明；在变量对象/活动对象（VO/AO）中权重高低也按照函数的形参->函数声明->变量声明顺序来。

如下代码：

    var a=1;
    function b(a) { 
        alert(a);
    }
    var b;
    alert(b); // function b(a) { alert(a); }
    b();  //undefined

变量对象/活动对象（VO/AO）填充及优先顺序

以上代码在进入执行上下文时，按照函数的形参->函数声明->变量声明顺序来填充，并且优先权永远都是函数的形参>函数声明>变量声明，所以只要alert(a)中的a是函数中的形参，就永远不会被函数和变量声明覆盖。就算没有赋值也是默认填充的undefined值。

第二部分：执行代码

经过“预解析”创建执行上下文之后，就进入执行代码阶段，VO/AO就会重新赋予真实的值，“预解析”阶段赋予的undefined值会被覆盖。

此阶段才是程序真正进入执行阶段，Javascript引擎会一行一行的读取并运行代码。此时那些变量都会重新赋值。

假如变量是定义在函数内的，而函数从头到尾都没被激活（调用）的话，则变量值永远都是undefined值。

进入了执行代码阶段，在“预解析”阶段所创建的任何东西可能都会改变，不仅仅是VO/AO，this和作用域链也会因为某些语句而改变，后面会讲到。

了解完Javascript的解析过程最后我们再来了解下firebug的控制台对Javascript的报错提示吧。

其实firebug的控制台也算是JavaScript的解释器，而且他们会提示我们哪行出现了错误或者错误发生在哪个时期，语法检查阶段错误，还是运行期错误。

如下：

    alert(var);// SyntaxError: syntax error 语法分析阶段错误 ：语法错误
    var=1;; // SyntaxError: missing variable name 语法分析阶段错误 ：var是保留字符，导致变量名丢失
    a=b=v // ReferenceError: v is not defined 运行期错误： v 是未定义的
    JavaScript错误信息)

有如此详细的错误提示，是不是就很快就知道代码中到底是哪里错了呢！

接下来我们详细来介绍执行上下文中的一个重要概念——作用域链。

作用域链（Scope Chain）

作用域链是处理标识符时进行变量查询的变量对象列表，每个执行上下文都有自己的变量对象：对于全局上下文而言，其变量对象就是全局对象本身；对于函数而言，其变量对象就是活动对象。

作用域链以及执行上下文的关系

在Javascript中只有函数能规定作用域，全局执行上下文中的 Scope 是全局上下文中的属性，也是最外层的作用域链。

函数的属性[[Scope]]是在“预解析”的时候就已经存在的了，它包含了所有上层变量对象，并一直保存在函数中。就算函数永远都没被激活（调用），[[Scope]]也都还是存在函数对象上。

创建执行上下文的 Scope 属性和进入执行上下文的过程如下：

Scope = AO + [[Scope]] //预解析时的 Scope 属性 
Scope = [AO].concat([[Scope]]); //执行阶段，将AO添加到作用域链的最前端

执行上下文定义的 Scope 属性变化过程

执行上下文中的[AO]是函数的活动对象，而[[Scope]]则是该函数属性作用域。当前函数的AO永远是在最前面的，保存在堆栈上，而每当函数激活的时候，这些AO都会压栈到该堆栈上，查询变量是先从栈顶开始查找，也就是说作用域链的栈顶永远是当前正在执行的代码所在环境的VO/AO（当函数调用结束后，则会从栈顶移除）。

通俗点讲就是：JavaScript解释器通过作用域链将不同执行位置上的变量对象串连成列表，并借助这个列表帮助JavaScript解释器检索变量的值。作用域链相当于一个索引表，并通过编号来存储它们的嵌套关系。当JavaScript解释器检索变量的值，会按着这个索引编号进行快速查找，直到找到全局对象为止，如果没有找到值，则传递一个特殊的 undefined值。

是不是又想到了一条JavaScript高效准则：为什么说在该函数内定义的变量，能减少函数嵌套能提高JavaScript的效率？因为函数定义的变量，此变量永远在栈顶，这样子查询变量的时间变短了。

作用域的特性

保证查询有序的访问所有变量和函数
作用域链感觉就是一个VO链表，当访问一个变量时，先在链表的第一个VO上查找，如果没有找到则继续在第二个VO上查找，直到搜索结束，也就是搜索到全局执行环境的VO中。这也就形成了作用域链的概念。

var color="blue";
function changecolor(){ 
    var anothercolor="red"; 
    function swapcolors(){
        var tempcolor=anothercolor; 
        anothercolor=color; 
        color=tempcolor; // Todo something 
    } 
    swapcolors();
}
changecolor();//这里不能访问tempcolor和anocolor;但是可以访问color;
alert("Color is now "+color);

作用域链保护变量安全

函数的作用域是在函数创建即“预解析”阶段就已经就已经定义了，而在代码执行阶段则是将函数的作用域添加到作用域链上。

原型链查询

在介绍“预解析”阶段时，我们有提到当创建函数时，同时也会创建原型链对象（prototype）函数天生的。原型链对象在作用域链中没有找到变量对象时，那么就会通过原型链来查找。

function Foo() { 
    function bar() { 
        alert(x); 
    } 
    bar();
}
Object.prototype.x = 10;
Foo(); // 10

上例中在作用域链中遍历查询，到了全局对象了，该对象继承自Object.prototype，因此，最终变量“x”的值就变成了10。不过，在原型链上定义变量对象有些浏览器不支持，譬如IE6，而且这样增加了变量对象的查询时间。所以变量声明尽量在调用函数AO里，即在用到该变量的函数内声明变量对象。

作用域是在“预解析”时就已经决定的，所以作用域被叫做静态作用域，而在执行阶段的则被叫做动态链，因为在执行阶段会改变作用域链中填充的值。