Koa入门教程[6]-初探源码

本文大纲

  • express 与 koa 的对比
  • Koa1 内核源码
  • 简要介绍 Koa2 内核与 koa1 的区别
  • 了解 Koa 中 http 协商缓存的实现机制
  • koa-router 源码
  • koa-view 源码

express

本文我们不讲解 express 的源码。但是 express 的实现机制对于我们了解 TJ 在设计框架时的思路有一定的参考意义。express 实现了一个类似于流的请求处理过程,其源码比 Koa 还要稍微复杂一点(主要是其内置了 Router 概念来实现路由)。如果对 express 的源码感兴趣的可以参考这两篇文章:

从 express 源码中探析其路由机制

NodeJS 框架之 Express4.x 源码分析

exporess 和 koa 都是用来对 http 请求进行 接收、处理、响应。在这个过程中,express 和 koa 都有提供中间件的能力来对请求和响应进行串联。同时要提供一个封装好的 执行上下文 来串联中间件。

因此,koa 和 express 就是把这些 http 处理能力打包在一起的一个完整的后端应用框架。涉及到了一个请求处理的完整流程,其中包含了这些知识概念:Application、Request、Response、COntext、Session、Cookie。

express 跟 koa 的区别是,express 使用的 ES5 时代的语言能力(没有使用 generator 和 async),因此 express 实现的中间件机制是传统的串行的流式运行(从第一个运行到最后一个后输出响应);而 koa 使用了 generator 或 async 从而实现了一种洋葱模型的中间件机制,所谓洋葱模型实际上就是中间件函数在运行过程中可以停下来,把执行权交给后面的中间件,等到合适的时机再回到函数内继续往下执行

Koa1 内核

本文我们还是主要分析 Koa1 的代码(因为 Generator 比 async 要绕一些难一些),我看的代码是基于 Koa 1.6.0。

对于 Koa1 来说,其实现是基于 ES6 的 Generator 函数。Generator 给了我们用同步代码编写异步的可能,他可以让程序执行流 流向  下方,在异步结束之后再返回之前的地方执行。Generator 就像一个迭代器,可以通过它的 next 方法不断去迭代来实现函数的步进式执行。对于 Generator 函数解决异步问题的学习可以参考 阮一峰的 ES6 教程 Generator 函数与异步

Koa 内核只有 1 千 行左右的代码。共包含 4 个文件:

1
2
3
4
application.js
request.js
response.js
context.js

我们从 package.json 中可以看到 Koa 的主入口是 lib/application.js. 这个入口做的事情便是导出了一个 Application 的 class 类。(可以看到 Koa 的实现相比 express 已经比较面向对象了)

而 Application 的 prototype 上被挂载了我们  常用的 application 的方法,例如 use, listen, callback, onerror

咦?是不是少了点 API? app.env,app.proxy 这些呢?

原来,这些是 Application 的实例属性,在 Application 实例化的时候会同步初始化。来看一下 Application 构造函数的代码:

1
2
3
4
5
6
7
8
9
10
function Application() {
if (!(this instanceof Application)) return new Application(); // 支持工厂函数模式创建
this.env = process.env.NODE_ENV || "development"; // 设置当前环境
this.subdomainOffset = 2; // 应用的子域偏移(这个主要是控制request.subdomain如何返回当前域名的哪个部分;具体可参考文档的request.subdomains)
this.middleware = []; // 存放应用中间件的数组
this.proxy = false; // 是否信任代理。为true时会让request.ips/hosts等字段读取X-Forward-*头
this.context = Object.create(context); // 在app挂载一个继承 context 对象的对象。
this.request = Object.create(request); // 在app挂载一个继承 request 对象的对象
this.response = Object.create(response); // 在app挂载一个继承 response 对象的对象
}

Application 类型的实现就是如此简单,除此之外,还继承了 EventEmitter 从而提供事件能力:

1
Object.setPrototypeOf(Application.prototype, Emitter.prototype);

 至此,Application 上的方法和属性我们都找到源头了,暂且先不分析其方法的具体实现。我们再来看看 request 和 response 对象。

而从 request.js 中可以看到,该文件就仅仅导出了一个 Object 对象,对象中所有函数和属性即是 Koa 中间件中 request api 的所有方法。简要摘录下该文件源码结构:

1
2
3
4
5
6
// request.js
module.exports = {
get header() {
return this.req.headers;
},
};

注意到这里面的 api 基本上就是对 Node.js 原生的 http.IncomingMessage 类型 API 的封装; response.js 也是类似的; context.js 也是类似的,并代理挂载了 request 和 response 的一些方法。那这里问题就来了: 上面代码中 this.req 为什么可以拿到 IncomingMessage 对象呢?这就要从 Koa 中间件是如何运行说起了。

中间件是如何运行起来的?

我们先看下中间件是如何注入到应用中的。我们在开发 Koa 应用时,通常是使用 app.use 来注册中间件。

1
2
3
4
app.use(function* (next) {
this.body = "123";
yield next;
});

而 use 函数做了一件很简单的事情: 把你的中间件置入 app.middleware 数组。

1
2
3
4
5
// 简化后的 use 函数
app.use = function (fn) {
this.middleware.push(fn);
return this;
};

由于 use 函数同时返回了 this 指针,因此 app.use 得以可以链式调用。再回到我们的话题: 中间件是如何运行起来的。 我们看下 Koa 的启动代码:

1
2
3
http.createServer(app.callback()).listen(3000);
// 或
app.listen(3000);

由于 listen 是一个语法糖,因此 http 请求 最终都是被 app.callback() 函数返回的一个 function 来执行。 我们看看 callback 到底返回了一个什么函数, 下面是我去掉了一些无关紧要的 error 处理代码之后的源码:

1
2
3
4
5
6
7
8
9
app.callback = function () {
var fn = co.wrap(compose(this.middleware)); // 把所有中间件包装成一个fn函数
var self = this;
// 返回一个闭包
return function handleRequest(req, res) {
var ctx = self.createContext(req, res); // 把Node原生的req和res包装成Koa的context对象
self.handleRequest(ctx, fn); // 开始执行中间件
};
};

其实原理很简单了,就是把 http 请求利用 createContext 函数包装为 context 对象,然后调用 app.handleRequest 把应用内所有中间件执行一遍并返回结果给浏览器。

还记得上文提到的一个问题: 为什么 request 对象内可以用 this.req 拿到原生请求? 原理在这里就显而易见了,正是 self.createContext 把原生 req 设置在了 ctx 对象上(这里就不展开源码讲解了)

现在流程基本清楚了。但这里有个难点:

  1. fn 函数是如何能够把所有 Generator 中间件执行的?
  2. 中间件执行完成后是如何响应给浏览器结果的?

delegates 挂载属性到 context

我们如果读过 koa 文档,会发现在中间件中 this/ctx 上是可以访问到 ctx.request 对象上的属性的。这个是因为 koa 在初始化 context 对象的过程中,把 request 上相关的属性挂载到了 ctx.

这是中间件执行之前创建 ctx 的过程:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
app.createContext = function (req, res) {
var context = Object.create(this.context);
var request = (context.request = Object.create(this.request)); // ctx可以访问request对象
var response = (context.response = Object.create(this.response));
context.app = request.app = response.app = this; // ctx可以访问app对象
context.req = request.req = response.req = req; //ctx可以访问原生req对象
context.res = request.res = response.res = res;
request.ctx = response.ctx = context; // request对象可以访问ctx
request.response = response; // request和rewspinse可以互相访问
response.request = request;
context.onerror = context.onerror.bind(context);
context.originalUrl = request.originalUrl = req.url;
context.cookies = new Cookies(req, res, {
keys: this.keys,
secure: request.secure,
});
context.accept = request.accept = accepts(req);
context.state = {};
return context;
};

这段代码还是无法解释为什么 ctx 上可以访问 request 对象的上的属性。但是这里有一点是有作用的:ctx 对象上面挂载了 request 对象。因此,在 ctx 的方法中可以通过 this.request 访问到 request 对象,这为 ctx 提供了访问 request 属性的基础。

上述的问题的答案,其实在 context 对象初始化的过程当中。我们看看 context 对象的初始化时做了个什么事情:

1
2
3
4
5
6
7
8
9
10

delegate(proto, 'request')
.method('acceptsLanguages')
.method('acceptsEncodings')
.method('acceptsCharsets')
.access('querystring')
.access('idempotent')
.access('socket')
.access('search')
...

可以看到,这里调用 delegate 这个库,给 context 对象添加了很多方法。实际上从 deleteate 源码中得知,delegate 原型是这样的:

1
2
3
4
5
6
7
8
9
Delegator.prototype.method = function (name) {
var proto = this.proto;
var target = this.target;
this.methods.push(name);
proto[name] = function () {
return this[target][name].apply(this[target], arguments);
};
return this;
};

这个很明显就是给 ctx 添加方法函数,函数内调用目标对象的方法。access 是通过 getter,setter 来访问 this[target]的属性。
至此,ctx 可以访问 request 和 response 属性的谜底就解开了。

中间件的合并和执行

中间件的执行流程和 koa2 是一致的。把中间件想作一个栈,请求会从顶部的第一个中间件开始处理,遇到 yield next 调用,就会进入下一个中间件中,直到最后没有 yield next 调用,再从栈底反弹,一个一个执行之前 next 之后的代码。

上文讲到了中间件执行主要靠这句代码合并为一个 fn 函数:

1
var fn = co.wrap(compose(this.middleware));

这里 compose 是来自 koa-compose 这个模块。 在前文《Koa 教程-常用中间件》中,我们已经了解了中间件的合并方式以及 koa-compose 的运作原理:总之就是通过 不断实例化Generator并作为参数传递给前一个Generator函数 的方式把多个 Generator 串联起来,最终执行第一个中间件  就相当于串联执行所有中间件。

那么,co.wrap 是什么呢? 这里看下 co 源码 (co 源码 4.6.0 加注释总共才 237 行):

1
2
3
4
5
6
7
8
9
10
11
co.wrap = function (fn) {
createPromise.__generatorFunction__ = fn;
return createPromise;
function createPromise() {
return co.call(this, fn.apply(this, arguments));
}
};

function co(gen) {
...
}

可以看到,co.wrap 仅仅就是返回了一个闭包, 该闭包用于利用 co 来执行原函数(关于 co 是如何执行 Generator 的,本文暂不讲解)。看到这里,会有点疑惑,wrap 包裹一层这是不是有点多此一举啊?实际上我上面省略了一点点代码,这里 Koa 是为了兼容 ES7 可能不需要 co 来运行中间件的情况。这里 fn 函数赋值的原始代码如下:

1
2
3
4
// ES7 合并后的中间件函数可以直接执行。ES6 generator的方式需要借助CO执行。 fn函数屏蔽了底层差异
var fn = this.experimental
? compose_es7(this.middleware)
: co.wrap(compose(this.middleware));

至此,我们已经梳理出整个 http 请求的流程,即: Koa 收到 http 连接回调后,对 InCompingMessage 进行包装为 ctx, 并调用中间件合并后的函数 fn 进行业务处理。业务处理的代码非常简单,就是以 ctx 为上下文执行中间件:

1
2
3
4
5
6
7
8
9
10
11
12
// handleRequest便是收到网络请求后中间件运行的起点
app.handleRequest = function (ctx, fnMiddleware) {
ctx.res.statusCode = 404;
onFinished(ctx.res, ctx.onerror);
// 注意这里: fnMiddleware.call(ctx) 就把中间件执行上下文设置为了 context 对象
fnMiddleware
.call(ctx)
.then(function handleResponse() {
respond.call(ctx);
})
.catch(ctx.onerror);
};

在开发 Koa 应用时,我们知道在中间件中使用 this 就是在访问 context 对象. 正是因为在 Koa 执行中间件  函数时将上下文设置为了 context 对象。

response 如何响应给浏览器的?

这个主要是在 co 执行中间件 resolve 之后利用了上文代码中看到的 respond 函数来实现。

1
2
3
4
5
6
fnMiddleware
.call(ctx)
.then(function handleResponse() {
respond.call(ctx);
})
.catch(ctx.onerror);

respond 函数主要是对 ctx 上设置的 body 内容进行解析,并选择合适的方法响应给浏览器。这里限于篇幅不再具体讲解了。

为什么可以不用 yield *

另外我们发现,在 Koa 的中间件里,我们通常用:

1
yield next

来运行下一个中间件。通过上面的原理,我们了解到所谓的 next 变量 实际上就是下一个中间件 Generator 函数的实例,可是我们会疑惑右值是一个 Generator 对象的时候 运行 Generator 实例为什么没有使用 yield *? 理论上,如果按照 Generator 的原始执行方式,没有使用 yield * 的话,这个语句只会返回 next 这个遍历器对象而已,是无法运行 next 函数的

这个问题的答案就在 co 源码里面,如果看过 co 的源码,会发现它是通过 右值.then(data=>{...}) 回调里不断递归调用 gen.next(data) 来实现自动执行。而 gen.next 又会返回一个新的右值 {value: xx, done:false} ,co 通过 toPromise  函数对右值进行 Promise 化从而可以调用 then,而 toPromise 函数中如果检测到这个右值是一个 Generator 遍历器对象,则会重新用 co 来 run 这个对象。

因此,co 里面可以支持使用了 yield * 的方式(这种方式 Generator 默认会展开下一层的遍历器);也可以支持 yield + 遍历器 的方式,这种方式是 co 自己检测到并运行这个迭代器的。

Koa2 内核

Koa2 主要是用 async await 代替了 Generator,用起来更方便了。async await 是 Generator 的语法糖,可以这样理解:

1
2
3
await --> 等于 yield
async --> 等于 Generator函数声明: function * () {}
调用 async 函数 --> 等于利用 co 来自动执行 Generator: co(function*(){})

co 运行器返回的是一个 Promise, async 函数运行后也是返回一个 Promise。

Koa2 里面直接使用了 ES6 语法来创建 Application 类型:

1
module.exports = class Application extends Emitter {};

Koa2 中的 app.use、app.listen 等实现与 Koa1 基本完全一致。 区别开始出现在 app.callback 函数里:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
callback() {
const fn = compose(this.middleware); // 合并中间件

if (!this.listenerCount('error')) this.on('error', this.onerror);

const handleRequest = (req, res) => {
const ctx = this.createContext(req, res);
return this.handleRequest(ctx, fn);
};

return handleRequest;
}

handleRequest(ctx, fnMiddleware) {
const res = ctx.res;
res.statusCode = 404;
const onerror = err => ctx.onerror(err);
const handleResponse = () => respond(ctx);
onFinished(res, onerror);
return fnMiddleware(ctx).then(handleResponse).catch(onerror);
}

可以看到 handleRequest 里面调用中间件函数 fnMiddleware 时不再设置上下文,而是直接传递 ctx 到中间件中。因此 Koa 在中间件里不是通过 this 获取上下文,而是用 ctx 变量。

另外一个主要区别就在于上面代码中这个 compose 了。

koa2 的 compose 模块

Koa2 使用了 4.x 版本的 koa-compose, 其实现有一些变化:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
function compose(middleware) {
if (!Array.isArray(middleware))
throw new TypeError("Middleware stack must be an array!");
for (const fn of middleware) {
if (typeof fn !== "function")
throw new TypeError("Middleware must be composed of functions!");
}

return function (context, next) {
// last called middleware #
let index = -1;
return dispatch(0);
function dispatch(i) {
if (i <= index)
return Promise.reject(new Error("next() called multiple times"));
index = i;
let fn = middleware[i];
if (i === middleware.length) fn = next;
if (!fn) return Promise.resolve();
try {
return Promise.resolve(fn(context, dispatch.bind(null, i + 1)));
} catch (err) {
return Promise.reject(err);
}
}
};
}

这个 compose 就是专门针对 async 函数而设计的了。 它最终返回的是个 function (context, next) 这样的闭包函数。 在上文讲到的 Koa2 的请求入口里 fnMiddleware(ctx) 的 fnMiddleware 实际上就是在调用这个函数。可以看到这个函数只接收了 context 参数,而 next 参数是 undefined。

我们再来看看这个函数内部做了啥。它实际上从 middleware 数组的第 0 项开始触发执行(dispath(0)),相当于主动在调用中间件 async 函数:

1
yourmid(ctx, next);

而这个 next 实际上传入的是下一个中间件函数。由此形成了递归调用。直到最后中间件没有了, fn = next 被赋值为 undefined(因为 next 的值是 undefined),然后回溯。回溯后返回的 Promise 交给 handleResponse 响应或错误处理:

1
2
const onerror = (err) => ctx.onerror(err);
return fnMiddleware(ctx).then(handleResponse).catch(onerror);

可以看到 Koa2 的错误处理机制,跟 Koa1 也是一样的,都是中间件中一旦发生 throw Error,则会触发 fnMiddleware 的 catch,进而触发 context 对象的 onerror,在 ctx.onerror 里面会做出浏览器响应并调用 app.onerror 兜底。

以上就是 Koa2 的执行流程。跟 Koa1 差别不是很大,这里没有再过多展开了,如果希望了解更详细的 Koa2 源码解读,这里推荐一篇知乎专栏

Koa 中协商缓存实现机制

我们知道在 http 协议中, 服务器端一般使用 http 报文的 if-none-match if-modify-since 字段来进行缓存协商。 Koa 提供了一个 request.fresh 函数来帮助你确定是否返回 304.

这个 fresh 函数的实现基于 npm 模块 fresh. 它内部会检查当前 response 响应头的 etag 和 last-modifyed 与 请求头里的 对应字段进行比对判断。

这个可以用在 Node 响应浏览器的最后一环时。

koa-route

我们先看一个简陋版的 router 是怎么做的。这个库叫做 koa-route (注意不是 koa-router 哦)

这个 route 库只做了一件事,就是帮我们生成简单的 generator 中间件,中间件的内容就是判断当前请求的路径是否是符合我们的配置要求,符合才执行。

其用法如下:

1
2
3
4
var _ = require("koa-route");

app.use(_.get("/pets", pets.list));
app.use(_.get("/pets/:name", pets.show));

其中 pets.list 假设就是我们针对 /pets 路径的处理函数。

实际上 _.get() 会把你传入的 path 包装成一个对其进行判断的 generator 中间件。类似于:

1
2
3
4
5
6
7
8
function * (next) {
if (this.path === '/pets' && this.method === 'get') {
...
}
else {
yield next
}
}

看他的源码也只有聊聊几行,核心在于这个 create 函数:

image.png

这个红圈圈出来的部分就是实际的 _.get 返回值,作为中间件给注册进了 Koa

koa-view

TODO

KOA 源码学习

Koa1 源码学习+co 源码学习
Koa2 源码学习
你知道 koa 中间件执行原理吗