React原理个人理解-Diff

前言

在前端领域中,接触到Diff算法基本上是基于现在的前端框架,如React、Vue等,目前的框架基本上都用到了Diff和V-dom,而Diff算法作为V-dom的加速器,在提高性能方面有极其重要的作用,在每次的update都能高效的渲染新的UI界面,使得大家不用在关心渲染方面上的问题,只需要专注于界面和业务需求;

前端框架上的Diff算法和传统的Diff有一点区别,因为框架上有针对使用场景的策略和处理,以下只通过对比和理解传统Diff算法来去理解现在React的Diff在React中的处理;

传统Diff算法

传统Diff算法本质是计算一棵树形结构转换成另一棵树形结构的最少操作,React本身是借助Virtual DOM+Diff使得它与传统的Dom操作有了极大的突破,但React的是在传统上的处理,所以我们现在先看看传统的Diff算法;

传统的Diff算法,操作包括替换、插入、删除,在对比时的复杂度为o(n**3)

o(n**3)的由来

编辑距离(Edit-Distance)

计算 字符串neigevor与Neigevoir的编辑距离(3)
n -> N Neigevor
r -> i Neigevoi
add r Neigevoir

同理对于dom这类的对象来说也是一样,由替换、插入、删除,但相对来说比只只有Edit-Distance复杂;

例如:

   before                 after
      A                     A  
    /   \                 /   \
   B     D     =>        B     D
  /                             \
 C                               E
                                  \
                                   C

B delete C
D add E
D add C

直观感受虽然只是做了3步,但是对于计算机来说需要对两个树进行遍历;
可能有人有点好奇遍历的方式,我个人是这么理解的,先找到两个树的差异再进行转换操作;

1、为何非要遍历两个树,不能只以before来遍历,不就o(n)?
如果直接before来遍历,遇到B删除C,D的时候增加E-C,看起来的确是,但after的可能性是无限的,如果变成:

    before                after
      A                     E  
    /   \                 /   \
   B     D     =>        A     F
  /                     / \
 C                     B   D
                      /
                     C

再以before来遍历,这样遍历的时候直接就变成直接生成整个after结果,这样不违背了Diff的原则(最少操作);

2、以下图为例,以直观来看只要生成一个E,然后将before放进去,然后再加一个G和F即可:
即便如此也是需要两个树嵌套遍历进行查询

    before                after
      A                     E  
    /   \                 /   \
   B     D     =>        A     F
  /                     / \
 C                     B   D
                      /
                     C
                    /
                   G
                   

以A为例,是否A需要遍历完整整个after
1.在after中遇到A,break去执行B的遍历,可能出现遍历到C的时候,C-G这样的情况,break就无法清楚G节点;
2.只判断父子节点,难保F一边可能也出现before;

所以当需要进行获取不同的节点时就需要o(n**2)的时间复杂度;

3、在获取到了差异后进行操作,多少个差异处理多少次难道不是o(n2)+o(n)或者在边找的时候边处理直接o(n2)?

第一反应是这个感觉,但后来想想是和Edit Distance相关;(个人理解)

还是以A为例:

1、在遍历E的时候,因为A的父节点为Null,E的也是Null,并且A!==E所以直接生成;
2、遍历到A的时候,存在Edit的问题,需要清楚是删除或是插入等操作;
3、所以需要遍历A的下一层子节点,发现都是B-D,所以A不用操作;
4、类推,当before的C在after中遍历到C的时候,同样需要看子节点,所以插入一个G;

所以是O(n**3);

简单点的理解就是时找到差异o(n2),然后寻找差异进行edit的是o(n),所以是o(n3);

React的Diff

如果有100个元素,在一次改变后就需要1000000的计算量,这对于前端来说肯定爆炸,
但100个元素在前端来说也不是那么罕见,例如列表等;所以直接用传统的Diff来去处理意义不是特别大,
可能还不一定有直接重新渲染来的直接,需要在传统的Diff上进行改造;

在不看React官方的优化前,其实我们也在了解Diff的过程中也遇到和理解的优化点;

1.在遍历查询差异节点时,只用一个作为基础O(n),上文说了会导致全部渲染,但实际这样的情况极少数发生;
    A、因为Dom的处理很少跨层级去移动,大部分都是appendChild、removeChild或者改变Child的内容;
    B、组件化,使得Dom更容易同级比对,不用考虑跨级;
  
2.即是减少一层遍历,也只是从o(n3)变成o(n2),所以还需要在操作节点的方面上处理,不用在遍历查找差异;
    A、因为同级比对,所以不进行对最优操作进行遍历,只需要考虑是不是该节点有改变;
    B、优化遍历过程中,部分并未进行改变的节点,可以不用再向下遍历;
    

目前来看已经有了不少改进,但是当父节点不变,子节点位置改变时,按上面说的会直接删除生成,也并不是好的处理方式;

    before                after
      A                     A  
    /   \                 /   \
   B     C     =>        C     B

最终其实需要做成的就是直接移动位置即可,下面有说到解决方法;

所以我们再来看看,React官方的假设基础:

1、两个不同类型的元素会产生出不同的树;
2、开发者可以通过 key prop 来暗示哪些子元素在不同的渲染下能保持稳定;

最终React的策略如下:

同层级对比(Tree Diff)

只对比前后树同层级的差异,直接新增或者删除;

 before                     after
      A                     D 
    /   \                 /   
   B     C     =>        A
                        / \       
                       B   C
                       
after里面的元素全部都重新生成;       

比对不同类型的元素(Component Diff)

如果节点为不同类型的元素时,直接进行删除然后重新创建新的元素,进而它的子节点即使和原先的子节点是一样也需要重新创建;
before                     after
<ConponentA />             <ConponentB />

ConponentA与ConponentB的元素皆为<div>test</div>,也是需要重新生成;

比对同一类型的元素(Element Diff)

before                     after
<ConponentA />             <ConponentA />

在前后元素类型相同后,进行ElementDiff的对比;

1、当节点为相同类型的元素时,如果只是改变属性子节点没有任何变化时,仅比对及更新有改变的属性;
   <div className="before" title="stuff" /> ===> <div className="after" title="stuff" />
   所以只需要修改 DOM 元素上的 className 属性
   
2、当节点为相同类型的元素时,子节点有变化,如位置、数目等,则会进行插入、删除、移动等操作;;
   before                     after
   <div>                       <div>
       <span>1</span>            <span>1</span>
       <span>2</span>            <span>2</span>
   </div>                        <span>3</span>
                               </div>
   在遍历完1和2的对比之后插入一个3即可;

key的重要性
key可以理解为身份标志,所以必须要保持唯一和稳定;

1、防止错误的操作,减少性能消耗;

before                         after
   <div>                           <div>
       <span key="1">1</span>          <span key="3">3</span>
       <span key="2">2</span>          <span key="1">1</span>
   </div>                              <span key="2">2</span>
                                   </div>
 
通过key可以发现1和2节点都是相同的节点,只需要移动插入3然后移动1、2即可;
避免之前文中说的的问题,删除重新而不是移动;

2、减少Diff时间

React是不会给组件增加Key,但是增加key属性的节点,组件实例会基于它们的key来决定是否更新以及复用,
在key相等的时候会认为同一元素,不需要进行过多的diff,只需要判断属性是否变化,而key不同则会销毁重新生成;

key的注意点

官方Demo

//父组件
state = [{id: 1}]
<div>
    <button onClick={setState([{id:2}, {id: 1})]} >在列表头插入元素</button>
    {
        state.map((value,inedx) => (<Item id={value.id} key={index} />))
    }
</div>

//Item组件
<div>
    <span>{props.id}</span>
    <input type="text" />
</div>

当用户在id:1的input输入value(test)后,再去点击按钮插入元素时,会出现在id:1的input输入值text出现在了id:2的input中


before                         after
    <Item id="1" key="0" />        <Item id="2" key="0" />
                                   <Item id="1" key="1" />
                                  
原因值因为key,key相等导致id:1和id:2当成相等,所以进行属性判断,
所以before的Item只修改了props.id,而不是在前面插入一个Item,只是1变成2,再加一个1;

**如果key是数组下标,那么修改顺序时会修改当前的key,导致非受控组件的state(比如输入框)
可能相互篡改导致无法预期的变动。所以在一些数组遍历的时候不建议用index当key使用**  

Diff注意点

  1. 减少直接对原生Dom的操作,保证Dom结构的稳定;(Tree Diff)
  2. 常出现的元素,只做Class的隐藏显示,不直接影响Dom结构处理;(Tree Diff)
  3. 避免Dom节点过多,可以使用灵活使用<></>、Css等处理;(Tree Diff)
  4. 尽量处理好子元素相同的组件,实现同类型的扩展;(Component Diff)
  5. 处理好key,确保稳定而且唯一;(Element Diff)
  6. 处理好shouldComponentUpdate,减少被动diff;(Element Diff)
  7. 处理好数组等大数据显示,如1000条时只显示能显示的数目既可以,不需要一次显示;(如react-virtualized);
  8. 减少列表元素中,元素移动过多;(Element Diff)

简单点总结就是简单(Dom,数据)、唯一(key,类型)、稳定(操作dom,列表元素);

    原文作者:Radis
    原文地址: https://segmentfault.com/a/1190000019697867
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞