能在编码时做的事,就不要推迟到运行时

TL.DR

软件是一个巨大的有限状态机。工程师日常做的bug修复、性能调优,本质上就是尽可能保证代码处于有序状态下。
不论OC还是Swift,都拥有强大的编译器作为辅助。尽可能多地将状态固定在编码时,就就减少了运行期的状态,使得软件的状态总数减少了。

状态总数少了,错误就少了,性能也就提升了。

Case 1:OC Runtime的Non fragile ivars

这个例子的关键点是性能

OC为了做到ABI兼容,改变了C、C++以来对象的内存结构,每个成员变量都需要两次寻址才能访问到。比如要获取obj的第n个变量的偏移地址,就要

*((&obj->isa.cls->data()->ro->ivars->first)[N]->offset);

看起来就慢爆了。

在实现上,LLVM为每个类的每个成员变量都分配了一个全局变量,用于存储该成员变量的偏移值。这样,访问每个变量需要两次寻址,先获取全局变量,再取全局变量的值作为地址找到真正的变量。

编译后的

obj->myInt = 42;

对应于如下的简单C语言代码

int32_t g_ivar_MyClass_myInt = 40;  // 全局变量
*(int32_t *)((uint8_t *)obj + g_ivar_MyClass_myInt) = 42;

这就是为什么ivar_t.offset用int指针来存储偏移值,而不是直接放一个int的原因。

struct ivar_t {
    int32_t *offset;  //注意,这里是指针
    const char *name;
    const char *type;
    
    //...
}

真正存放偏移值的地址是固定不变的,在编译时就确定了下来。因此才能用区区2条指令搞定动态布局的成员变量。

Case 2:矩阵相乘

这个例子的关键点是减少错误

《能在编码时做的事,就不要推迟到运行时》

如图所示,要保证第一个矩阵中的列数必须与第二个矩阵中的行数相同。简单的做法是做运行时检查

struct Matrix {
  let rows: Int
  let columns: Int
}

func multiply(m1: Matrix, _ m2: Matrix) -> Matrix? {
  // do the matrices have the correct sizes?
  precondition(m1.columns == m2.rows)
  
  // bunch of math...
}

更好的做法是在编码时,就不允许出现行列不等的情况

protocol Dimension {
  static var size: Int { get set }
}

func multiply<U: Dimension, V: Dimension, W: Dimension>
             (m1: Matrix<U,V>, _ m2: Matrix<V,W>) -> Matrix<U,W> {
  // bunch of math...
  return Matrix<U,W>()
}

运行结果

struct NumExamples: Dimension { static var size = 20 }
struct NumFeatures: Dimension { static var size = 10 }
struct OneDimensional: Dimension { static var size = 1 }

let A = Matrix<NumExamples, NumFeatures>()
let B = Matrix<NumFeatures, OneDimensional>()

let C = multiply(A, B)   // yay!

let D = multiply(B, A)   // compiler error

完整的优化过程不在本文的讨论范围内,感兴趣的可以看
这里

参考链接

objc explain: Non-fragile ivars
Dynamic ivars: solving a fragile base class problem
编程世界的熵增原理

    原文作者:NSFish
    原文地址: https://segmentfault.com/a/1190000015684020
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞