本篇文档是参考SuperAgent英文文档翻译整理成的。前段时间,在一个爬虫项目中用到了SuperAgent,因为遇到了一些坑,就详细的查阅了一下官方的文档,为了便于其他朋友查阅参考,我便对翻译的文档进行了简要整理。后期,我还会针对SuperAgent使用中遇到的一些问题进行完善,并附于文末Issue章节。同时也欢迎大家分享自己在使用SuperAgent过程中遇到的一些问题和解决方法。
1 简介
SuperAgent是一个轻量级、灵活的、易读的、低学习曲线的客户端请求代理模块,使用在NodeJS环境中。
官方文档:http://visionmedia.github.io/superagent
使用示例:
var request = require('superagent')
request
.post('/api/pet')
.send({ name: 'Manny', species: 'cat' })
.set('X-API-Key', 'foobar')
.set('Accept', 'application/json')
.then(res => {
alert('yay got ' + JSON.stringify(res.body));
});
在后面的讲解中我们都使用request
表示superagent
对象,代码中也省略如下部分:
var request = require('superagent')
2 请求
通过调用request
对象then()
或end()
方法,或使用await
关键字,发送一个请求。
request
.get('/search')
.then(res => {
// res.body, res.headers, res.status
})
.catch(err => {
// err.message, err.response
});
请求的方法类型(DELETE
,HEAD
,PATCH
,POST
和PUT
)可以通过如下字符串来指定:
// 指定使用GET方法
request('GET', '/search')
.then(function (response) {
// success
}, function (error) {
// failure
});
也可以使用end()
方法
request('GET', '/search')
.end(function(error, response){
if (response.ok) {
}
});
可以使用完整的URLs,由于同源策略的原因,这需要服务器实现了跨域访问。
request
.get('https://example.com/search')
.then(res => {
});
除了上述使用的GET
方法外,也可以使用DELETE
,HEAD
,PATCH
,POST
和PUT
方法,只需要简单地更改一下方法的名称。
request
.head('/favicon.ico')
.then(response => {
});
在旧版本IE浏览器中delete
是系统的关键字,为了兼容这一点,可以调用del()
方法来避免冲突。
request
.del('/book/1')
.end(function(response){
});
request
默认使用GET方法发送请求,可以简写成如下:
request('/search', (error, response) => {
});
3 HTTP/2
如果要使用HTTP/2协议发送请求,可以调用http2()
方法。目前还暂不支持对服务器 HTTP/2能力的检测。
const request = require('superagent');
const res = await request
.get('https://example.com/h2')
.http2();
4 设置头部字段
报文header字段设置通过调用set()
方法。
request
.get('/search')
.set('API-Key', 'foobar')
.set('Accept', 'application/json')
.then(callback);
你也可以传递一个对象来设置多个字段:
request
.get('/search')
.set({
'API-Key': 'foobar',
' Accept': 'application/json'
})
.then(callback);
5 GET请求
当我们使用GET请求传递查询字符串的时候,可以使用query()
方法,同时传递一个对象作为参数,下面的代码将产生一个URL为/search?query=Manny&range=1..5&order=desc
请求:
request
.get('/search')
.query({ query: 'Manny' })
.query({ range: '1..5' })
.query({ order: 'desc' })
.then(response => {
});
或者传递一个对象
request
.get('/search')
.query({
query: 'Manny',
range: '1..5',
order: 'desc'
})
.then(response => {
});
query()
也接受一个字符串作为参数
request
.get('/querystring')
.query('search=Manny&range=1..5')
.then(response => {
})
参数拼接字符&
也可以用下面的方式替代:
request
.get('/querystring')
.query('search=Manny')
.query('range=1..5')
.then(response => {
});
6 HEAD请求
query()
方法也可以用于HEAD请求,下面的代码将会产生一个URL为 /users?email=joe@smith.com
的请求:
request
.head('/users')
.query({
email: 'joe@smith.com'
})
.then(response => {
});
7 POST / PUT请求
一个典型的JSON POST请求的代码实现如下,设置相应的Content-type头字段,再写入数据。在这个例子里,仅使用JSON字符串:
request.post('/user')
.set('Content-Type', 'application/json')
.send('{"name":"tj","pet":"tobi"}')
.then(callback)
JSON成为通用的数据格式后,request
对象默认Content-type类型就是application/json
,因此代码就可以简化为:
request.post('/user')
.send('{"name":"tj","pet":"tobi"}')
.then(callback)
也可以多次调用send()
方法完成
request.post('/user')
.send({ name: 'tj' })
.send({ pet: 'tobi' })
.then(callback
默认情况下,发送字符串时Content-type
会被设置为application/x-www-form-urlencoded
,多次调用send()
方法会使用&
连接起来,下面的代码中最终结果为:name=tj&pet=tobi
request.post('/user')
.send('name=tj')
.send('pet=tobi')
.then(callback);
SuperAgent请求的数据格式是可以扩展的,不过默认支持“form”和“json”两种格式,想要以application/x-www-form-urlencoded格式发送数据的话,则可以调用type()
方法并传入'form'
参数,这里默认的参数是“json”。下面的请求中,POST请求体为name=tj&pet=tobi
。
request.post('/user')
.type('form')
.send({ name: 'tj' })
.send({ pet: 'tobi' })
.then(callback)
支持发送FormData
对象。下面的例子中发送id="myForm"
的<form>
表单数据:
request.post('/user')
.send(new FormData(document.getElementById('myForm')))
.then(callback)
提示:FormData
类型其实是在XMLHttpRequest 2级定义的,它是为序列化表以及创建与表单格式相同的数据(当然是用于XHR传输)提供便利。
8 Content-Type设置
通常使用set()
方法
request.post('/user')
.set('Content-Type', 'application/json')
简便的方法是调用.type()
方法,传递一个规范的MIME
名称,包括type/subtype
,或者一个简单的后缀就像xml
,json
,png
这样。例如:
request.post('/user')
.type('application/json')
request.post('/user')
.type('json')
request.post('/user')
.type('png')
9 序列化请求体
SuperAgent会自动序列化JSON和表单数据,你也可以为其他类型设置自动序列化:
request.serialize['application/xml'] = function (obj) {
return 'string generated from obj';
};
// going forward, all requests with a Content-type of
// 'application/xml' will be automatically serialized
如果你希望以自定义格式发送数据,可以通过.serialize()
方法为每个请求设置相应的序列化方法,以替换内置序列化方法:
request
.post('/user')
.send({foo: 'bar'})
.serialize(obj => {
return 'string generated from obj';
});
10 重发请求
当给定retry()
方法时,SuperAgent将自动重试请求,如果它们以短暂的方式失败或者可能由于因特网连接不正常而失败。
这个方法有两个可选参数:重试次数(默认值3)和回调函数。它在每次重发之前调用回调(error, res)
。回调可以返回true/false
,以决定是否要重发请求。
request
.get('https://example.com/search')
.retry(2) // or:
.retry(2, callback)
.then(finished);
需要注意的是:应该只对HTTP等幂请求使用retry()
方法(即,到达服务器的多个请求不会导致不希望的副作用,如重复购买,否则会产生多个订单)。
11 设置Accept
与type()
方法一样,这里可以调用accept()
方法来设置Accept接受类型,这个值将会被request.types
所引用,支持传递一个规范的MIME
名称,包括type/subtype
,或者一个简单的后缀:xml
,json,``png
等。例如:
request.get('/user')
.accept('application/json')
request.get('/user')
.accept('json')
request.post('/user')
.accept('png')
Facebook和接收JSON:如果你是在调用Facebook的API,确保请求头中Accept: application/json
。否则,Facebook 将返回Content-Type: text/javascript; charset=UTF-8
响应, SuperAgent将不会解析这个响应,读取响应体会得到undefined
。你需要在请求对象request
加上request.accept('json')
或者request.header('Accept', 'application/json')
代码。
12 查询字符串
调用.query()方法可以自动生成查询字符串,比如向URL为?format=json&dest=/login
发送一个post请求:
request
.post('/')
.query({ format: 'json' })
.query({ dest: '/login' })
.send({ post: 'data', here: 'wahoo' })
.then(callback);
默认情况下,查询字符串的拼装是没有特定的顺序。调用sortQuery()
方法将默认按照ASCII码顺序进行,你也可以传递一个比较函数来指定排序规则,比较函数需要传递两个参数(在回调过程中会自动传递进两个参数,这两个参数就是用于比较的查询字符串),返回值是正整数、负整数或者0。
// 选择默认排序
request.get('/user')
.query('name=Nick')
.query('search=Manny')
.sortQuery()
.then(callback)
// 客制化的排序函数
request.get('/user')
.query('name=Nick')
.query('search=Manny')
.sortQuery((a, b) => a.length - b.length)
.then(callback)
上述客制化的排序函数中,a
和b
实际上就是sortQuery()
回调过程中传递进去的两个查询字符串,按照查询字符串长度来排序的,长度大的排在前面。
13 TLS选项
在Node.js中使用SuperAgent,支持对HTTPS请求的下列配置:
-
ca()
:将CA证书设置为信任 -
cert()
:设置客户端证书链 -
key()
: 设置客户端私钥 -
pfx()
: 设置客户端PFX或PKCS12编码的私钥和证书链
更多信息可以查看:https.request 官方文档.
var key = fs.readFileSync('key.pem'),
cert = fs.readFileSync('cert.pem');
request
.post('/client-auth')
.key(key)
.cert(cert)
.then(callback);
var ca = fs.readFileSync('ca.cert.pem');
request
.post('https://localhost/private-ca-server')
.ca(ca)
.then(res => {});
14 解析响应体
SuperAgent 可以解析常用的响应体,目前支持application/x-www-form-urlencoded
,application/json
, 和multipart/form-data
格式。如下代码,你也可以对其它类型的响应体设置相应的解析方法:
// 浏览器端使用SuperAgent
request.parse['application/xml'] = function (str) {
return {'object': 'parsed from str'};
};
// Node中使用SuperAgent
request.parse['application/xml'] = function (res, cb) {
// 解析响应内容,设置响应体代码
cb(null, res);
};
// 自动解析响应体
通过调用buffer(true)
和parse(fn)
的配合,你可以设置一个定制的解析器(定制的解析器优先于内置解析器)。 如果没有启用响应缓冲(buffer(false)
),那么响应事件的触发将不会等待主体解析器完成,因此响应体将不可用。
14.1 JSON/Urlencoded
response.body
是解析后的内容对象,比如对于一个请求响应'{"user":{"name":"tobi"}}'
字符串,response.body.user.name
会返回"tobi"
。同样的,与x-www-form-urlencoded
格式的"user[name]=tobi"
解析后值也是一样,只支持嵌套的一个层次,如果需要更复杂的数据,请使用JSON格式。
数组会以重复键名的方式进行发送,send({color: ['red','blue']})
会发送"color=red&color=blue"
。如果你希望数组键的名称包含"[]"
,则需要自己添加,SuperAgent是不会自动添加。
14.2 Multipart
Node客户端通过Formidable模块来支持multipart/form-data
类型,当解析一个multipart
响应时,response.files
属性就可以用。假设一个请求响应得到下面的数据:
--whoop
Content-Disposition: attachment; name="image"; filename="tobi.png"
Content-Type: image/png
... data here ...
--whoop
Content-Disposition: form-data; name="name"
Content-Type: text/plain
Tobi
--whoop--
你可以获取到res.body.name
名为’Tobi’
,res.files.image
为一个file
对象,包括一个磁盘文件路径、文件名称,还有其它的文件属性。
14.3 Binary
在浏览器中可以使用responseType('blob')
来请求处理二进制格式的响应体。在Node.js中运行此API是不必要的。此方法的支持参数值为:
-
'blob'
:会被传递为XmlHTTPRequest
的responseType
属性。 -
'arraybuffer'
:会被传递为XmlHTTPRequest
的responseType
属性。
req.get('/binary.data')
.responseType('blob')
.then(res => {
// res.body will be a browser native Blob type here
});
更多的信息可以查看:xhr.responseType 文档.
15 响应对象属性
SuperAgent请求得到响应后,响应对象的属性主要有:
text
:未解析前的响应内容,字符串类型。一般只在mime
类型能够匹配"text/"
,"json"
,"x-www-form-urlencoding"
的情况下,这个属性才会有效,默认为nodejs客户端提供;body
:响应数据解析后的对象,对象类型。header
:解析之后的响应头数据,数组类型。type
:响应报文的Content-Type
值,字符串类型。charset
:响应的字符集,字符串类型。status
:响应状态标识。statusCode
:响应的状态码,数整数类型。如:200、302、404、500等。
15.1 text
response.text
包含未解析前的响应内容,一般只在mime
类型能够匹配"text/"
,"json"
,"x-www-form-urlencoding"
的情况下,这个属性才会有效,默认为nodejs客户端提供,这是出于节省内存的考虑。因为缓冲大数据量的文本(如multipart文件或图像)的效率非常低。要强制缓冲,请参阅“响应缓冲”部分。
15.2 body
与SuperAgent请求数据自动序列化一样,响应数据也会自动的解析,当为一个Content-Type
定义一个解析器后,就能自动解析,默认解析包含application/json
和application/x-www-form-urlencoded
,可以通过response.body
来访问解析对象.
15.3 header fields
response.header包含解析之后的响应头数据,字段值都是Node处理成小写字母形式,如response.header['content-length']
。
15.4 Content-Type
Content-Type
响应头字段是一个特列,服务器提供response.type
来访问它,默认response.charset
是空的(如果有的话,则为指定类型),例如Content-Type
值为"text/html; charset=utf8"
,则response.type
为text/html
,response.charset
为"utf8"
。
15.5 status
响应状态标识可以用来判断请求是否成功,除此之外,可以用SuperAgent来构建理想的RESTful服务器,这些标识目前定义为:
var type = status / 100 | 0;
// status / class
res.status = status;
res.statusType = type;
// basics
res.info = 1 == type;
res.ok = 2 == type;
res.clientError = 4 == type;
res.serverError = 5 == type;
res.error = 4 == type || 5 == type;
// sugar
res.accepted = 202 == status;
res.noContent = 204 == status || 1223 == status;
res.badRequest = 400 == status;
res.unauthorized = 401 == status;
res.notAcceptable = 406 == status;
res.notFound = 404 == status;
res.forbidden = 403 == status;
16.中止请求
可以通过req.abort()
来中止请求。
17.请求超时
有时网络和服务器会“卡住”,并且在接受请求后从不响应。设置超时以避免请求永远等待。
req.timeout({deadline:ms})
或req.timeout(ms)
: ms是大于0的毫秒数。为整个请求设置一个截止时间(包括所有上传、重定向、服务器处理时间)完成。如果在那个时间内没有得到完整的响应,请求将被中止。req.timeout({response:ms})
:设置等待第一个字节从服务器到达的最大时间,但不限制整个下载可以消耗多长时间。响应超时应该比服务器响应的时间长至少几秒钟,因为它还包括进行DNS查找、TCP/IP和TLS连接的时间,以及上传请求数据的时间。
你应该同时使用deadline
和response
超时。通过这种方式,你可以通过较短的response
超时来快速检测无响应网络,并且使用较长的deadline
来在缓慢但可靠的网络上提供一个合适的时间。注意,这两个计时器都限制了上传文件的上传时间。如果上传文件,则使用长时间超时。
request
.get('/big-file?network=slow')
.timeout({
response: 5000, // Wait 5 seconds for the server to start sending,
deadline: 60000, // but allow 1 minute for the file to finish loading.
})
.then(res => {
/* responded in time */
}, err => {
if (err.timeout) { /* timed out! */ } else { /* other error */ }
});
超时错误会提供一个timeout
属性。
18.认证
Node和浏览器中都可以通过auth()
方法来完成认证。
request
.get('http://local')
.auth('tobi', 'learnboost')
.then(callback);
nodejs客户端也可以通过传递一个像下面这样的URL:
request.get('http://tobi:learnboost@local').then(callback);
默认在浏览器中只使用基本的认证方式,你也可以添加{type:'auto'}
,以启用浏览器中内置的所有方法(摘要、NTLM等):
request.auth('digest', 'secret', {type:'auto'})
19.跟随重定向
默认是向上跟随5个重定向,可以通过调用.res.redirects(n)来设置个数:
request
.get('/some.png')
.redirects(2)
.then(callback);
20.全局状态代理
20.1 保存cookies
在Node SuperAgent中,默认情况下不保存cookie,但是可以使用.agent()方法创建一个含有cookie的SuperAgent副本。每个副本都有一个单独的cookie数据。
const agent = request.agent();
agent
.post('/login')
.then(() => {
return agent.get('/cookied-page');
});
在浏览器中,cookie由浏览器自动管理,因此.agent()
不会格式化处理cookies。
20.2 多请求的默认选项
使用agent
进行的多个请求中,agent
调用的常规方法也将默认用于agent
的后续所有的请求中。这些常规方法包括:use
, on
, once
, set
, query
, type
, accept
, auth
, withCredentials
, sortQuery
, retry
, ok
, redirects
, timeout
, buffer
, serialize
, parse
, ca
, key
, pfx
, cert
。
const agent = request.agent()
.use(plugin)
.auth(shared);
await agent.get('/with-plugin-and-auth');
await agent.get('/also-with-plugin-and-auth');
21.管道数据
在nodejs客户端中,可以使用一个请求流来传输数据。需要注意的是:用pipe()
取代了end()
和then()
方法。
下面是将文件内容作为请求进行管道传输例子:
const request = require('superagent');
const fs = require('fs');
const stream = fs.createReadStream('path/to/my.json');
const req = request.post('/somewhere');
req.type('json');
stream.pipe(req);
注意,在管道传输到请求时,superagent使用分块传输编码发送管道数据,这不是所有服务器(例如Python WSGI服务器)都支持的。
下面是输送一个响应流到文件的管道传输例子:
const stream = fs.createWriteStream('path/to/my.json');
const req = request.get('/some.json');
req.pipe(stream);
不能将管道、回调或promise
混合在一起使用,不能尝试对end()
或response
对象进行管道操作(pipe()
),如下所示:
// 不能做下面的操作
const stream = getAWritableStream();
const req = request
.get('/some.json')
// BAD: this pipes garbage to the stream and fails in unexpected ways
.end((err, this_does_not_work) => this_does_not_work.pipe(stream))
const req = request
.get('/some.json')
.end()
// BAD: this is also unsupported, .pipe calls .end for you.
.pipe(nope_its_too_late);
22.Multipart/form-data请求
superagen提供了attach()
和 field()
方法用于构建multipart/form-data请求。
当你使用了field()
或者attach()
,你就不能使用 send()
方法,你也不能设置 Content-Type (superagen会自动设置纠正后的type
)。
22.1 附件
可以使用attach(name, [file], [options])
进行文件发送。你可以通过多次调用attach()
附加多个文件。attach()
的参数说明如下:
-
name
:文件名 -
file
:文件路径字符串,或Blob/Buffer对象。 -
options
:(可选)字符串或自定义文件名或{filename: string}
对象。在Node中也支持{contentType: 'mime/type'}
。在浏览器中创建一个具有适当类型的Blob
。
request
.post('/upload')
.attach('image1', 'path/to/felix.jpeg')
.attach('image2', imageBuffer, 'luna.jpeg')
.field('caption', 'My cats')
.then(callback);
22.2 字段值
与HTML中表单的字段类似,你可以调用field(name,value)
方法来设置字段,假设你想上传一个图片的并附带自己的名称和邮箱,那么你可以像下面这样:
request
.post('/upload')
.field('user[name]', 'Tobi')
.field('user[email]', 'tobi@learnboost.com')
.field('friends[]', ['loki', 'jane'])
.attach('image', 'path/to/tobi.png')
.then(callback);
23.压缩
NodeJS客户端本身就提供压缩响应内容,所以你不需要做任何其它处理。
24.响应缓冲
为了强制缓冲response.text
这样未解析前的响应内容(一般只在mime类型能够匹配”text/”,”json”,”x-www-form-urlencoding”的情况下才进行缓冲),可以调用buffer()
方法,想取消默认的文本缓冲响应像text/plain
, text/html
这样的,可以调用buffer(false)
方法。
// 强制缓冲
request
.get('/userinfo')
.buffer(true)
.then(callback)
// 取消缓冲
request
.get('/userinfo')
.buffer(false)
.then(callback)
当缓冲response.buffered
标识有效了,那么就可以在一个回调函数里处理缓冲和未缓冲的响应.
25.跨域资源共享(CORS)
出于安全原因,浏览器将阻止跨源请求,除非服务器使用CORS头进行选择。浏览器还将做出额外的选项请求,以检查服务器允许的HTTP头和方法。更多信息可参阅:CORS.
withCredentials()
方法可以激活发送原始cookie
的能力,不过只有在Access-Control-Allow-Origin
不是一个通配符(*)
,并且Access-Control-Allow-Credentials
为’true’
的情况下才行。
request
.get('https://api.example.com:4001/')
.withCredentials()
.then(res => {
assert.equal(200, res.status);
assert.equal('tobi', res.text);
})
26.错误处理
回调函数总是会传递两个参数:error
错误和response
响应。如果没有发生错误,第一个参数将为null
。
request
.post('/upload')
.attach('image', 'path/to/tobi.png')
.then(response => {
});
你可以加入监听错误的代码,错误产生之后会执行监听代码。
request
.post('/upload')
.attach('image', 'path/to/tobi.png')
.on('error', handle)
.then(response => {
});
注意:
superagent默认情况下,对响应4xx和5xx的认为不是错误,例如当响应返回一个500或者403的时候,这些状态信息可以通过response.error
,response.status
和其它的响应属性来查看。
不产生响应的网络故障、超时和其他错误将不包含response.error
,response.status
属性。
如果希望处理404个或其他HTTP错误响应,可以查询error.status
属性。当发生HTTP错误(4xx或5xx响应)时,response.error
属性是error
对象,这可以用来作以下检查:
if (error && error.status === 404) {
alert('oh no ' + response.body.message);
}
else if (error) {
// all other error types we handle generically
}
或者,可以使用ok(callback)
方法来判断响应是否是错误。对ok()
的回调得到响应,如果响应成功,则返回true。
request.get('/404')
.ok(res => res.status < 500)
.then(response => {
// reads 404 page as a successful response
})
27.进度跟踪
superagent在大型文件的上传和下载过程中触发progress
事件。
request.post(url)
.attach('field_name', file)
.on('progress', event => {
/* the event is:
{
direction: "upload" or "download"
percent: 0 to 100 // may be missing if file size is unknown
total: // total file size, may be missing
loaded: // bytes downloaded or uploaded so far
} */
})
.then()
event属性包括:
-
direction
:upload
或download
-
percent
:0
到100
,文件大小未知的话为无效 -
total
:文件总大小,可能为无效 -
loaded
: 已经下载或上传的字节数
28.Promise和Generator支持
SuperAgent的请求是一个“thenable”对象,它与JavaScript承诺和异步/等待语法兼容。
如果你正在使用promises
,那么就不要再调用end()
或pipe()
方法。任何使用then()
或者await
操作都会禁用所有其他使用请求的方式。
像CO或类似KOA这样的Web框架,可以在superagent使用yield
:
const req = request
.get('http://local')
.auth('tobi', 'learnboost');
const res = yield req;
请注意,superagent期望全局promises
对象存在。在Internet Explorer或Node.js 0.10中需要使用polyfill
组件。
29.浏览器和Node版本
SuperAgent有两个实现:一个是用于web浏览器(使用XHR)的版本,另一个是用于Node.JS (使用核心的http模块)版本。
30.3XX处理
HTTP 3XX是重定向报文,superagent默认会自动跟踪下去,我们也不能使用redirect(0)
的方法来禁止重定向,因此需要使用原生的http
来处理。
request.post({
url: '/login',
}, function (err, res, body) {
if (!err && (res.statusCode == 301 || res.statusCode == 302)) {
// 登录成功后服务端返回重定位报文
cookie += ';' + res.headers['set-cookie']
res1.redirect('listall')
} else if (res.statusCode == 200) {
// 登录失败服务端会返回200
// ...
} else {
// 其他错误信息处理
console.log(err)
}
})
31.Issue
欢迎大家在文末评论区提出自己在使用过程中遇到的问题及其解决方法!!!