1.HTTP协议的主要特点
- 简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
- 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
- 无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
- 无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
2.HTTP报文的组成部分
- 请求报文:请求行(包含HTTP方法、页面地址、HTTP协议、版本)、请求头(key-value值,告诉服务端我要什么内容,什么类型)、空行(分隔请求头和请求体)、请求体
- 响应报文:响应行、响应头、空行、响应体
3.HTTP方法
- GET:获取资源
- POST:传输资源
- HEAD:获取报文首部
- PUT:更新资源
- DELETE:删除资源
4.POST和GET的区别
- GET在浏览器回退时是无害的,而POST会再次提交申请(*);
- GET请求会被浏览器主动缓存,而POST不会,除非手动设置(*);
- GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留(*);
- GET请求在url中传输的参数是有参数限制的(2kb),而POST没有限制(*);
- GET参数通过url传递,POST放在request body中(*)。
- GET产生的URL地址可以被收藏,而POST不可以;
- 对参数的数据类型,GET只接受ASCII字符,而POST没有限制;
- GET比POST更不安全,因为参数直接暴露在url上,所以不能用来传递敏感信息;
- GET请求只能进行url编码,而POST支持多种编码方式;
为了避免CSRF攻击,将GET请求改为了POST请求。
5.HTTP状态码
- 1**:指示信息,表示请求已接收,继续处理;
- 2**:成功,表示请求已被成功接收;
- 3**:重定向,要完成请求必须进行更进一步的操作;
- 4**:客户端错误,请求有语法错误或请求无法实现;
- 5**:服务器错误,服务器未能实现合法的请求。
200 OK:客户端请求成功;
206 Partial Content:客户发送了一个带有Range头的GET请求,服务器完成了它;(常见于用Vedio标签播放一个视频地址,或使用audio播放一个音频地址,当视频、音频文件很大的时候,基本返回206)
301 Moved Permanently:所请求的页面已经转移至新的url;
302 Found:所请求的页面已经 临时 转移至新的url;
304 Not Modified:客户端有缓冲的文档并发出了一个条件性的请求,服务器告诉客户,原来缓冲的文档还可以继续使用。
400 Bad Request:客户端请求有语法错误,不能被服务器所理解;(少)
401 Unauthorized:请求未经授权,这个状态码必须和www-Authenticate报文域一起使用;(少)
403 Forbidden:对被请求页面的访问被禁止;(多,例如在页面中有一个地址,不能直接访问,只能通过服务器访问)
404 Not Found:请求资源不存在;
500 Internal Server Error:服务器发生不可预期的错误,原来缓冲的文档还可以继续使用;
503 Server Unavailable:请求未完成,服务器临时过载或宕机,一段时间后可恢复正常。
补充:XMLHttpRequest 的状态,XMLHttpRequest.readyState 0: 请求未初始化;
1: 服务器连接已建立;
2: 请求已接收;
3: 请求处理中;
4: 请求已完成,且响应已就绪;(xmlhttp.readyState==4 && xmlhttp.status==200)
6.持久连接
持久连接(Connection:keep-alive,HTTP/1.1版本支持,HTTP/1.0版本不支持)
HTTP协议采用“请求-应答”模式,当使用普通模式,即非Keep-Alive模式时,每个请求/应答客户和服务器都要新建一个连接,完成之后立即断开连接(HTTP协议为无连接的协议)。
当时用Keep-Alive模式(又称持久连接、连接重用)时,Keep-Alive功能使客户端到服务器端的连接持续有效,当出现对服务器的后续请求时,Keep-Alive功能避免了建立或重新建立连接。
7.管线化(持久连接的情况下)
在使用持久连接的情况下,
某个连接上消息的传递类似于:请求1->响应1->请求2->响应2->请求3->响应3。(->表示中间未断开)
某个连接上的消息变成了类似这样:请求1->请求2->请求3->响应1->响应2->响应3。(打包请求,打包响应)
HTTP管线化是将多个HTTP要求(request)整批提交的技术,而在传送过程中不需先等待服务端的回应。管线化机制须通过永久连接(persistent connection)完成,仅HTTP/1.1支持此技术(HTTP/1.0不支持),并且只有GET和HEAD要求可以进行管线化,而POST则有所限制。此外,初次创建连接时也不应启动管线机制,因为对方(服务器)不一定支持HTTP/1.1版本的协议。
管线化特点(原理:把请求和响应打包)
1.管线化机制通过持久连接完成,仅HTTP/1.1支持此技术(*);
2.只有GET和HEAD请求可以进行管线化,而POST则有所限制(*);
3.初次连接时不应启动管线机制,因为对方(服务器)不一定支持HTTP/1.1版本的协议(*);
4.管线化不会影响响应到来的顺序,如上面的例子所示,响应返回的顺序并未改变;
5.HTTP/1.1要求服务器端支持管线化,但并不要求服务器端也对响应进行管线化处理,只是要求对于管线化的请求不失败即可;
6.由优于上面提到的服务器端问题,开启管线化很可能并不会带来大幅度的性能提升,而且很多服务器端和代理程序对管线化的支持并不好,因此现代浏览器Chrome和Firefox默认并未开启管线化支持。