Algebraic Effects是一个在编程语言研究领域新兴的机制,虽然目前还没有工业语言实现它,但是在React社区会经常听到关于它的讨论。React最近的很多新特性的背后实际上是Algebraic Effects的概念。因此,我花了一些时间来了解Algebraic Effects,希望体悟到React团队是如何理解这些新特性的。
Algebraic Effects
每一个Algebraic Effect都是一次【程序控制权】的巡回:
【effect发起者】发起effect,并暂停执行(暂时交出程序控制权)
-> 沿着调用栈向上查找对应的effect handler(类似于try…catch的查找方式)
-> effect handler执行(获得程序控制权)
-> effect handler执行完毕,【effect发起者】继续执行(归还程序控制权)
例子(这并不是合法的JavaScript):
function getName(user) {
let name = user.name;
if (name === null) {
name = perform 'ask_name'; // perform an effect to get a default name!
}
return name;
}
function makeFriends(user1, user2) {
user1.friendNames.add(getName(user2));
user2.friendNames.add(getName(user1));
}
const arya = { name: null };
const gendry = { name: 'Gendry' };
try {
makeFriends(arya, gendry);
} handle (effect) { // effect handler!
if (effect === 'ask_name') {
const defaultName = await getDefaultNameFromServer();
resume with defaultName; // jump back to the effect issuer, and pass something back!
}
}
console.log('done!');
注意几点:
effect发起者不需要知道effect是如何执行的(解耦),effect的执行逻辑由调用者来定义。
这一点与try…catch相同,抛出错误的人不需要知道错误是如何被处理的。
getName
可以看成纯函数。易于测试。effect执行完以后,会回到effect发起处,并提供effect的执行结果。
这一点与try…catch不同,try…catch无法恢复执行。
- 中间调用者对Algebraic Effects是无感的,比如例子中的
makeFriends
。
Algebraic Effects 与 async / await 的区别
用async / await实现上面的例子:
async function getName(user) {
let name = user.name;
if (name === null) {
name = await getDefaultNameFromServer();
}
return name;
}
async function makeFriends(user1, user2) {
user1.friendNames.add(await getName(user2));
user2.friendNames.add(await getName(user1));
}
const arya = { name: null };
const gendry = { name: 'Gendry' };
makeFriends(arya, gendry)
.then(() => console.log('done!'));
异步性会感染所有上层调用者
可以发现,makeFriends
现在变成异步的了。这是因为异步性会感染所有上层调用者。如果要将某个同步函数改成async函数,是非常困难的,因为它的所有上层调用者都需要修改。
而在前面Algebraic Effects的例子中,中间调用者makeFriends
对Algebraic Effects是无感的。只要在某个上层调用者提供了effect handler就好。
可复用性的区别
注意另一点,getName
直接耦合了副作用方法getDefaultNameFromServer
。而在前面Algebraic Effects的例子中,副作用的执行逻辑是【在运行时】【通过调用关系】【动态地】决定的。这大大增强了getName的可复用性。
在async / await的例子中,通过依赖注入能够达到与Algebraic Effects类似的可复用性。如果getName
通过依赖注入来得到副作用方法getDefaultNameFromServer
,那么getName
函数在可复用性上,确实与使用Algebraic Effects时相同。但是前面所说的【异步性会感染所有上层调用者】的问题依然存在,getName
和makeFriends
都要变成异步的。
Algebraic Effects 与 Generator Functions 的区别
与async / await类似,Generator Function的调用者在调用Generator Function时也是有感的。Generator Function将程序控制权交给它的直接调用者,并且只能由直接调用者来恢复执行、提供结果值。
直接调用者也可以选择将程序控制权沿着执行栈继续向上交。这样的话,直接调用者(下面例子的makeFriends
)自己也要变成Generator Function(被感染,与async / await类似),直到遇到能提供【结果值】的调用者(下面例子的main
)。
function* getName(user) {
let name = user.name;
if (name === null) {
name = yield 'ask_name';
}
return name;
}
function* makeFriends(user1, user2) {
user1.friendNames.add(yield* getName(user2));
user2.friendNames.add(yield* getName(user1));
}
async function main() {
const arya = { name: null };
const gendry = { name: 'Gendry' };
let gen = makeFriends(arya, gendry);
let state = gen.next();
while(!state.done) {
if (state.value === 'ask_name') {
state = gen.next(await getDefaultNameFromServer());
}
}
}
main().then(()=>console.log('done!'));
可以看出,在可复用性上,getName
没有直接耦合副作用方法getDefaultNameFromServer
,而是让某个上层调用者来完成副作用。这一点与使用Algebraic Effects时相同。
redux-sagas就使用Generator Functions,将副作用的执行从saga中抽离出来,saga只需要发起副作用。这使得saga成为纯函数,易于测试。
但是,依然存在感染调用者的问题。
React中的Algebraic Effects
在React Fiber架构:可控的“调用栈”这篇文章中,我们讨论了React Fiber架构是一种可控的执行模型,每个fiber执行完自己的工作以后就会将控制权交还给调度器,由调度器来决定什么时候执行下一个fiber。
虽然JavaScript不支持Algebraic Effects(事实上,支持Algebraic Effects的语言屈指可数),但是在React Fiber架构的帮助下,React可以模拟一些很实用的Algebraic Effects。
Suspend
<Suspend>
就是一个例子。当React在渲染的过程中遇到尚未就绪的数据时,能够暂停渲染。等到数据就绪的时候再继续:
// cache相关的API来自React团队正在开发的react-cache:
// https://github.com/facebook/react/tree/master/packages/react-cache
const cache = createCache();
const UserResource = createResource(fetchUser); // fetchUser is async
const User = (props) => {
const user = UserResource.read( // synchronously!
cache,
props.id
);
return <h3>{user.name}</h3>;
}
function App() {
return (
<div>
<Suspense fallback={<div>Loading...</div>}>
<User id={123} />
</Suspense>
</div>
);
}
react-cache是React团队正在开发的工具,将
<Suspense>
用于数据获取的场景,让需要等待数据的组件“暂停”渲染。目前已经上线的,通过
React.lazy
来暂停渲染的能力,其实也是类似的原理。
理论上,UserResource.read
可以看做发起了一个Algebraic Effect。User发出这个effect以后,控制权暂时交给了React(因为React是User的调用者)。React scheduler提供了对应的effect handler,检查cache中是否有对应id的user:
- 如果在cache中,则立即将控制权交还给User,并提供对应的user数据。
- 如果不在cache中,则调用fetchUser从网络请求对应id的user,在此过程中,渲染暂停,`<Suspense>`渲染fallback视图。得到结果以后,将控制权交还给User,并提供对应的user数据。
实际上,它是通过throw来模拟Algebraic Effect的。如果数据尚未准备好,UserResource.read
会抛出一个特殊的promise。得益于React Fiber架构,调用栈并不是React scheduler -> App -> User
,而是:先React scheduler -> App
然后React scheduler -> User
。因此User组件抛出的错误会被React scheduler接住,React scheduler会将渲染“暂停”在User组件。这意味着,App组件的工作不会丢失。等到promise解析到数据以后,从User fiber开始重新渲染就好了(相当于控制权直接交还给User)。
如果直接使用调用栈来管理组件树的渲染(递归渲染),那么App组件的渲染工作会因为User抛出值而丢失,下次渲染需要从头开始。
Hooks
React团队将hooks都看做Algebraic Effect。useState的返回值取决于它的所处“虚拟调用栈”,即它在组件树中的位置,即fiber。比如一个组件树中有2个Counter组件,那么这两个Counter组件实例所处的上下文是不一样的,因此它们的useState返回值是独立的。
参考资料
Algebraic effects, Fibers, Coroutines…
Algebraic Effects for the Rest of Us