本篇文章篇幅比較長(zhǎng),先來(lái)個(gè)思維導(dǎo)圖預(yù)覽一下。
利用 TCP/IP 協(xié)議族進(jìn)行網(wǎng)絡(luò)通信時(shí),會(huì)通過(guò)分層順序與對(duì)方進(jìn)行通信。發(fā)送端從應(yīng)用層往下走,接收端則從鏈路層往上走。如下:
如下圖所示:
在網(wǎng)絡(luò)體系結(jié)構(gòu)中,包含了眾多的網(wǎng)絡(luò)協(xié)議,這篇文章主要圍繞 HTTP 協(xié)議(HTTP/1.1版本)展開。
HTTP協(xié)議(HyperText Transfer Protocol,超文本傳輸協(xié)議)是用于從WWW服務(wù)器傳輸超文本到本地瀏覽器的傳輸協(xié)議。它可以使瀏覽器更加高效,使網(wǎng)絡(luò)傳輸減少。它不僅保證計(jì)算機(jī)正確快速地傳輸超文本文檔,還確定傳輸文檔中的哪一部分,以及哪部分內(nèi)容首先顯示(如文本先于圖形)等。
HTTP是客戶端瀏覽器或其他程序與Web服務(wù)器之間的應(yīng)用層通信協(xié)議。在Internet上的Web服務(wù)器上存放的都是超文本信息,客戶機(jī)需要通過(guò)HTTP協(xié)議傳輸所要訪問(wèn)的超文本信息。HTTP包含命令和傳輸信息,不僅可用于Web訪問(wèn),也可以用于其他因特網(wǎng)/內(nèi)聯(lián)網(wǎng)應(yīng)用系統(tǒng)之間的通信,從而實(shí)現(xiàn)各類應(yīng)用資源超媒體訪問(wèn)的集成。
我們?cè)跒g覽器的地址欄里輸入的網(wǎng)站地址叫做URL (Uniform Resource Locator,統(tǒng)一資源定位符)。就像每家每戶都有一個(gè)門牌地址一樣,每個(gè)網(wǎng)頁(yè)也都有一個(gè)Internet地址。當(dāng)你在瀏覽器的地址框中輸入一個(gè)URL或是單擊一個(gè)超級(jí)鏈接時(shí),URL就確定了要瀏覽的地址。瀏覽器通過(guò)超文本傳輸協(xié)議(HTTP),將Web服務(wù)器上站點(diǎn)的網(wǎng)頁(yè)代碼提取出來(lái),并翻譯成漂亮的網(wǎng)頁(yè)。
HTTP通信機(jī)制是在一次完整的 HTTP 通信過(guò)程中,客戶端與服務(wù)器之間將完成下列7個(gè)步驟:
GET/sample/hello.jsp HTTP/1.1
HTTP/1.1 200 OK
Connection:keep-alive
,TCP 連接在發(fā)送后將仍然保持打開狀態(tài),于是,客戶端可以繼續(xù)通過(guò)相同的連接發(fā)送請(qǐng)求。保持連接節(jié)省了為每個(gè)請(qǐng)求建立新連接所需的時(shí)間,還節(jié)約了網(wǎng)絡(luò)帶寬。應(yīng)用 HTTP 協(xié)議時(shí),必定是一端擔(dān)任客戶端角色,另一端擔(dān)任服務(wù)器端角色。僅從一條通信線路來(lái)說(shuō),服務(wù)器端和客服端的角色是確定的。HTTP 協(xié)議規(guī)定,請(qǐng)求從客戶端發(fā)出,最后服務(wù)器端響應(yīng)該請(qǐng)求并返回。換句話說(shuō),肯定是先從客戶端開始建立通信的,服務(wù)器端在沒(méi)有接收到請(qǐng)求之前不會(huì)發(fā)送響應(yīng)。
HTTP 是一種無(wú)狀態(tài)協(xié)議。協(xié)議自身不對(duì)請(qǐng)求和響應(yīng)之間的通信狀態(tài)進(jìn)行保存。也就是說(shuō)在 HTTP 這個(gè)級(jí)別,協(xié)議對(duì)于發(fā)送過(guò)的請(qǐng)求或響應(yīng)都不做持久化處理。這是為了更快地處理大量事務(wù),確保協(xié)議的可伸縮性,而特意把 HTTP 協(xié)議設(shè)計(jì)成如此簡(jiǎn)單的。
可是隨著 Web 的不斷發(fā)展,我們的很多業(yè)務(wù)都需要對(duì)通信狀態(tài)進(jìn)行保存。于是我們引入了 Cookie 技術(shù)。有了 Cookie 再用 HTTP 協(xié)議通信,就可以管理狀態(tài)了。
Cookie 技術(shù)通過(guò)在請(qǐng)求和響應(yīng)報(bào)文中寫入 Cookie 信息來(lái)控制客戶端的狀態(tài)。Cookie 會(huì)根據(jù)從服務(wù)器端發(fā)送的響應(yīng)報(bào)文內(nèi)的一個(gè)叫做 Set-Cookie 的首部字段信息,通知客戶端保存Cookie。當(dāng)下次客戶端再往該服務(wù)器發(fā)送請(qǐng)求時(shí),客戶端會(huì)自動(dòng)在請(qǐng)求報(bào)文中加入 Cookie 值后發(fā)送出去。服務(wù)器端發(fā)現(xiàn)客戶端發(fā)送過(guò)來(lái)的 Cookie 后,會(huì)去檢查究竟是從哪一個(gè)客戶端發(fā)來(lái)的連接請(qǐng)求,然后對(duì)比服務(wù)器上的記錄,最后得到之前的狀態(tài)信息。
HTTP 協(xié)議使用 URI 定位互聯(lián)網(wǎng)上的資源。正是因?yàn)?URI 的特定功能,在互聯(lián)網(wǎng)上任意位置的資源都能訪問(wèn)到。
HTTP 協(xié)議的初始版本中,每進(jìn)行一個(gè) HTTP 通信都要斷開一次 TCP 連接。比如使用瀏覽器瀏覽一個(gè)包含多張圖片的 HTML 頁(yè)面時(shí),在發(fā)送請(qǐng)求訪問(wèn) HTML 頁(yè)面資源的同時(shí),也會(huì)請(qǐng)求該 HTML 頁(yè)面里包含的其他資源。因此,每次的請(qǐng)求都會(huì)造成無(wú)畏的 TCP 連接建立和斷開,增加通信量的開銷。
為了解決上述 TCP 連接的問(wèn)題,HTTP/1.1 和部分 HTTP/1.0 想出了持久連接的方法。其特點(diǎn)是,只要任意一端沒(méi)有明確提出斷開連接,則保持 TCP 連接狀態(tài)。旨在建立一次 TCP 連接后進(jìn)行多次請(qǐng)求和響應(yīng)的交互。在 HTTP/1.1 中,所有的連接默認(rèn)都是持久連接。
持久連接使得多數(shù)請(qǐng)求以管線化方式發(fā)送成為可能。以前發(fā)送請(qǐng)求后需等待并接收到響應(yīng),才能發(fā)送下一個(gè)請(qǐng)求。管線化技術(shù)出現(xiàn)后,不用等待亦可發(fā)送下一個(gè)請(qǐng)求。這樣就能做到同時(shí)并行發(fā)送多個(gè)請(qǐng)求,而不需要一個(gè)接一個(gè)地等待響應(yīng)了。
比如,當(dāng)請(qǐng)求一個(gè)包含多張圖片的 HTML 頁(yè)面時(shí),與挨個(gè)連接相比,用持久連接可以讓請(qǐng)求更快結(jié)束。而管線化技術(shù)要比持久連接速度更快。請(qǐng)求數(shù)越多,時(shí)間差就越明顯。
用于 HTTP 協(xié)議交互的信息被稱為 HTTP 報(bào)文。請(qǐng)求端(客戶端)的 HTTP 報(bào)文叫做請(qǐng)求報(bào)文;響應(yīng)端(服務(wù)器端)的叫做響應(yīng)報(bào)文。HTTP 報(bào)文本身是由多行(用 CR LF 作換行符)數(shù)據(jù)構(gòu)成的字符串文本。
HTTP 報(bào)文大致可分為報(bào)文首部和報(bào)文主體兩部分。兩者由最初出現(xiàn)的空行(CR LF)來(lái)劃分。通常,并不一定有報(bào)文主體。如下:
請(qǐng)求報(bào)文的首部?jī)?nèi)容由以下數(shù)據(jù)組成:
請(qǐng)求報(bào)文的示例,如下:
響應(yīng)報(bào)文的首部?jī)?nèi)容由以下數(shù)據(jù)組成:
響應(yīng)報(bào)文的示例,如下:
舉個(gè)栗子,下面是一個(gè) HTTP 請(qǐng)求的報(bào)文:
GET /index.htm HTTP/1.1Host: sample.com
其中,下面的這行就是請(qǐng)求行,
GET /index.htm HTTP/1.1
/index.htm
指明了請(qǐng)求訪問(wèn)的資源對(duì)象,也叫做請(qǐng)求 URI;HTTP/1.1
,即 HTTP 的版本號(hào),用來(lái)提示客戶端使用的 HTTP 協(xié)議功能。綜合來(lái)看,大意是請(qǐng)求訪問(wèn)某臺(tái) HTTP 服務(wù)器上的 /index.htm
頁(yè)面資源。
同樣舉個(gè)栗子,下面是一個(gè) HTTP 響應(yīng)的報(bào)文:
HTTP/1.1 200 OKDate: Mon, 10 Jul 2017 15:50:06 GMTContent-Length: 256Content-Type: text/html <html>...
其中,下面的這行就是狀態(tài)行,
HTTP/1.1 200 OK
HTTP/1.1
表示服務(wù)器對(duì)應(yīng)的 HTTP 版本;200 OK
表示請(qǐng)求的處理結(jié)果的狀態(tài)碼和原因短語(yǔ)。先來(lái)回顧一下首部字段在報(bào)文的位置,HTTP 報(bào)文包含報(bào)文首部和報(bào)文主體,報(bào)文首部包含請(qǐng)求行(或狀態(tài)行)和首部字段。
在報(bào)文眾多的字段當(dāng)中,HTTP 首部字段包含的信息最為豐富。首部字段同時(shí)存在于請(qǐng)求和響應(yīng)報(bào)文內(nèi),并涵蓋 HTTP 報(bào)文相關(guān)的內(nèi)容信息。使用首部字段是為了給客服端和服務(wù)器端提供報(bào)文主體大小、所使用的語(yǔ)言、認(rèn)證信息等內(nèi)容。
首部字段名 | 冒號(hào) | 字段值 |
---|---|---|
Content-Type | : | text/html |
Keep-Alive | : | timeout=30, max=120 |
首部字段根據(jù)實(shí)際用途被分為以下4種類型:
類型 | 描述 |
---|---|
通用首部字段 | 請(qǐng)求報(bào)文和響應(yīng)報(bào)文兩方都會(huì)使用的首部 |
請(qǐng)求首部字段 | 從客戶端向服務(wù)器端發(fā)送請(qǐng)求報(bào)文時(shí)使用的首部。補(bǔ)充了請(qǐng)求的附加內(nèi)容、客戶端信息、響應(yīng)內(nèi)容相關(guān)優(yōu)先級(jí)等信息 |
響應(yīng)首部字段 | 從服務(wù)器端向客戶端返回響應(yīng)報(bào)文時(shí)使用的首部。補(bǔ)充了響應(yīng)的附加內(nèi)容,也會(huì)要求客戶端附加額外的內(nèi)容信息。 |
實(shí)體首部字段 | 針對(duì)請(qǐng)求報(bào)文和響應(yīng)報(bào)文的實(shí)體部分使用的首部。補(bǔ)充了資源內(nèi)容更新時(shí)間等與實(shí)體有關(guān)的的信息。 |
首部字段名 | 說(shuō)明 |
---|---|
Cache-Control | 控制緩存的行為 |
Connection | 逐挑首部、連接的管理 |
Date | 創(chuàng)建報(bào)文的日期時(shí)間 |
Pragma | 報(bào)文指令 |
Trailer | 報(bào)文末端的首部一覽 |
Transfer-Encoding | 指定報(bào)文主體的傳輸編碼方式 |
Upgrade | 升級(jí)為其他協(xié)議 |
Via | 代理服務(wù)器的相關(guān)信息 |
Warning | 錯(cuò)誤通知 |
通過(guò)指定首部字段 Cache-Control 的指令,就能操作緩存的工作機(jī)制。
可用的指令按請(qǐng)求和響應(yīng)分類如下:
緩存請(qǐng)求指令
指令 | 參數(shù) | 說(shuō)明 |
---|---|---|
no-cache | 無(wú) | 強(qiáng)制向服務(wù)器再次驗(yàn)證 |
no-store | 無(wú) | 不緩存請(qǐng)求或響應(yīng)的任何內(nèi)容 |
max-age = [秒] | 必需 | 響應(yīng)的最大Age值 |
max-stale( =[秒]) | 可省略 | 接收已過(guò)期的響應(yīng) |
min-fresh = [秒] | 必需 | 期望在指定時(shí)間內(nèi)的響應(yīng)仍有效 |
no-transform | 無(wú) | 代理不可更改媒體類型 |
only-if-cached | 無(wú) | 從緩存獲取資源 |
cache-extension | - | 新指令標(biāo)記(token) |
緩存響應(yīng)指令
指令 | 參數(shù) | 說(shuō)明 |
---|---|---|
public | 無(wú) | 可向任意方提供響應(yīng)的緩存 |
private | 可省略 | 僅向特定用戶返回響應(yīng) |
no-cache | 可省略 | 緩存前必須先確認(rèn)其有效性 |
no-store | 無(wú) | 不緩存請(qǐng)求或響應(yīng)的任何內(nèi)容 |
no-transform | 無(wú) | 代理不可更改媒體類型 |
must-revalidate | 無(wú) | 可緩存但必須再向源服務(wù)器進(jìn)行確認(rèn) |
proxy-revalidate | 無(wú) | 要求中間緩存服務(wù)器對(duì)緩存的響應(yīng)有效性再進(jìn)行確認(rèn) |
max-age = [秒] | 必需 | 響應(yīng)的最大Age值 |
s-maxage = [秒] | 必需 | 公共緩存服務(wù)器響應(yīng)的最大Age值 |
cache-extension | - | 新指令標(biāo)記(token) |
public 指令Cache-Control: public
當(dāng)指定使用 public 指令時(shí),則明確表明其他用戶也可利用緩存。
private 指令Cache-Control: private
當(dāng)指定 private 指令后,響應(yīng)只以特定的用戶作為對(duì)象,這與 public 指令的行為相反。緩存服務(wù)器會(huì)對(duì)該特定用戶提供資源緩存的服務(wù),對(duì)于其他用戶發(fā)送過(guò)來(lái)的請(qǐng)求,代理服務(wù)器則不會(huì)返回緩存。
no-cache 指令Cache-Control: no-cache
Cache-Control: no-cache=Location
由服務(wù)器返回的響應(yīng)中,若報(bào)文首部字段 Cache-Control 中對(duì) no-cache 字段名具體指定參數(shù)值,那么客戶端在接收到這個(gè)被指定參數(shù)值的首部字段對(duì)應(yīng)的響應(yīng)報(bào)文后,就不能使用緩存。換言之,無(wú)參數(shù)值的首部字段可以使用緩存。只能在響應(yīng)指令中指定該參數(shù)。
no-store 指令Cache-Control: no-store
當(dāng)使用 no-store 指令時(shí),暗示請(qǐng)求(和對(duì)應(yīng)的響應(yīng))或響應(yīng)中包含機(jī)密信息。因此,該指令規(guī)定緩存不能在本地存儲(chǔ)請(qǐng)求或響應(yīng)的任一部分。
注意:no-cache 指令代表不緩存過(guò)期的指令,緩存會(huì)向源服務(wù)器進(jìn)行有效期確認(rèn)后處理資源;no-store 指令才是真正的不進(jìn)行緩存。
s-maxage 指令Cache-Control: s-maxage=604800(單位:秒)
max-age 指令Cache-Control: max-age=604800(單位:秒)
min-fresh 指令Cache-Control: min-fresh=60(單位:秒)
min-fresh 指令要求緩存服務(wù)器返回至少還未過(guò)指定時(shí)間的緩存資源。
max-stale 指令Cache-Control: max-stale=3600(單位:秒)
only-if-cached 指令Cache-Control: only-if-cached
表示客戶端僅在緩存服務(wù)器本地緩存目標(biāo)資源的情況下才會(huì)要求其返回。換言之,該指令要求緩存服務(wù)器不重新加載響應(yīng),也不會(huì)再次確認(rèn)資源的有效性。
must-revalidate 指令Cache-Control: must-revalidate
使用 must-revalidate 指令,代理會(huì)向源服務(wù)器再次驗(yàn)證即將返回的響應(yīng)緩存目前是否仍有效。另外,使用 must-revalidate 指令會(huì)忽略請(qǐng)求的 max-stale 指令。
proxy-revalidate 指令Cache-Control: proxy-revalidate
proxy-revalidate 指令要求所有的緩存服務(wù)器在接收到客戶端帶有該指令的請(qǐng)求返回響應(yīng)之前,必須再次驗(yàn)證緩存的有效性。
no-transform 指令Cache-Control: no-transform
使用 no-transform 指令規(guī)定無(wú)論是在請(qǐng)求還是響應(yīng)中,緩存都不能改變實(shí)體主體的媒體類型。這樣做可防止緩存或代理壓縮圖片等類似操作。
Cache-Control: private, community='UCI'
通過(guò) cache-extension 標(biāo)記(token),可以擴(kuò)展 Cache-Control 首部字段內(nèi)的指令。上述 community 指令即擴(kuò)展的指令,如果緩存服務(wù)器不能理解這個(gè)新指令,就會(huì)直接忽略掉。
Connection 首部字段具備以下兩個(gè)作用:
控制不再轉(zhuǎn)發(fā)的首部字段Connection: Upgrade
在客戶端發(fā)送請(qǐng)求和服務(wù)器返回響應(yīng)中,使用 Connection 首部字段,可控制不再轉(zhuǎn)發(fā)給代理的首部字段,即刪除后再轉(zhuǎn)發(fā)(即Hop-by-hop首部)。
管理持久連接Connection: close
HTTP/1.1 版本的默認(rèn)連接都是持久連接。當(dāng)服務(wù)器端想明確斷開連接時(shí),則指定 Connection 首部字段的值為 close。Connection: Keep-Alive
HTTP/1.1 之前的 HTTP 版本的默認(rèn)連接都是非持久連接。為此,如果想在舊版本的 HTTP 協(xié)議上維持持續(xù)連接,則需要指定 Connection 首部字段的值為 Keep-Alive。
表明創(chuàng)建 HTTP 報(bào)文的日期和時(shí)間。Date: Mon, 10 Jul 2017 15:50:06 GMT
HTTP/1.1 協(xié)議使用在 RFC1123 中規(guī)定的日期時(shí)間的格式。
Pragma 首部字段是 HTTP/1.1 版本之前的歷史遺留字段,僅作為與 HTTP/1.0 的向后兼容而定義。Pragma: no-cache
Cache-Control: no-cache
指定緩存的處理方式最為理想。但是要整體掌握所有中間服務(wù)器使用的 HTTP 協(xié)議版本卻是不現(xiàn)實(shí)的,所以,發(fā)送的請(qǐng)求會(huì)同時(shí)包含下面兩個(gè)首部字段:Cache-Control: no-cachePragma: no-cache
Trailer: Expires
首部字段 Trailer 會(huì)事先說(shuō)明在報(bào)文主體后記錄了哪些首部字段??蓱?yīng)用在 HTTP/1.1 版本分塊傳輸編碼時(shí)。
Transfer-Encoding: chunked
Upgrade: TSL/1.0
用于檢測(cè) HTTP 協(xié)議及其他協(xié)議是否可使用更高的版本進(jìn)行通信,其參數(shù)值可以用來(lái)指定一個(gè)完全不同的通信協(xié)議。
Via: 1.1 a1.sample.com(Squid/2.7)
該首部字段通常會(huì)告知用戶一些與緩存相關(guān)的問(wèn)題的警告。
Warning 首部字段的格式如下:Warning:[警告碼][警告的主機(jī):端口號(hào)] '[警告內(nèi)容]'([日期時(shí)間])
最后的日期時(shí)間可省略。
HTTP/1.1 中定義了7種警告,警告碼對(duì)應(yīng)的警告內(nèi)容僅推薦參考,另外,警告碼具備擴(kuò)展性,今后有可能追加新的警告碼。
警告碼 | 警告內(nèi)容 | 說(shuō)明 |
---|---|---|
110 | Response is stale(響應(yīng)已過(guò)期) | 代理返回已過(guò)期的資源 |
111 | Revalidation failed(再驗(yàn)證失敗) | 代理再驗(yàn)證資源有效性時(shí)失?。ǚ?wù)器無(wú)法到達(dá)等原因) |
112 | Disconnection operation(斷開連接操作) | 代理與互聯(lián)網(wǎng)連接被故意切斷 |
113 | Heuristic expiration(試探性過(guò)期) | 響應(yīng)的試用期超過(guò)24小時(shí)(有效緩存的設(shè)定時(shí)間大于24小時(shí)的情況下) |
199 | Miscellaneous warning(雜項(xiàng)警告) | 任意的警告內(nèi)容 |
214 | Transformation applied(使用了轉(zhuǎn)換) | 代理對(duì)內(nèi)容編碼或媒體類型等執(zhí)行了某些處理時(shí) |
299 | Miscellaneous persistent warning(持久雜項(xiàng)警告) | 任意的警告內(nèi)容 |
首部字段名 | 說(shuō)明 |
---|---|
Accept | 用戶代理可處理的媒體類型 |
Accept-Charset | 優(yōu)先的字符集 |
Accept-Encoding | 優(yōu)先的內(nèi)容編碼 |
Accept-Language | 優(yōu)先的語(yǔ)言(自然語(yǔ)言) |
Authorization | Web認(rèn)證信息 |
Expect | 期待服務(wù)器的特定行為 |
From | 用戶的電子郵箱地址 |
Host | 請(qǐng)求資源所在服務(wù)器 |
If-Match | 比較實(shí)體標(biāo)記(ETag) |
If-Modified-Since | 比較資源的更新時(shí)間 |
If-None-Match | 比較實(shí)體標(biāo)記(與 If-Macth 相反) |
If-Range | 資源未更新時(shí)發(fā)送實(shí)體 Byte 的范圍請(qǐng)求 |
If-Unmodified-Since | 比較資源的更新時(shí)間(與 If-Modified-Since 相反) |
Max-Forwards | 最大傳輸逐跳數(shù) |
Proxy-Authorization | 代理服務(wù)器要求客戶端的認(rèn)證信息 |
Range | 實(shí)體的字節(jié)范圍請(qǐng)求 |
Referer | 對(duì)請(qǐng)求中 URI 的原始獲取方 |
TE | 傳輸編碼的優(yōu)先級(jí) |
User-Agent | HTTP 客戶端程序的信息 |
Accept: text/html, application/xhtml xml, application/xml; q=0.5
q=[數(shù)值]
來(lái)表示權(quán)重值,用分號(hào)(;)進(jìn)行分隔。權(quán)重值的范圍 0~1(可精確到小數(shù)點(diǎn)后三位),且 1 為最大值。不指定權(quán)重值時(shí),默認(rèn)為 1。Accept-Charset: iso-8859-5, unicode-1-1; q=0.8
Accept-Charset 首部字段可用來(lái)通知服務(wù)器用戶代理支持的字符集及字符集的相對(duì)優(yōu)先順序。另外,可一次性指定多種字符集。同樣使用 q=[數(shù)值]
來(lái)表示相對(duì)優(yōu)先級(jí)。
Accept-Encoding: gzip, deflate
Accept-Encoding 首部字段用來(lái)告知服務(wù)器用戶代理支持的內(nèi)容編碼及內(nèi)容編碼的優(yōu)先順序,并可一次性指定多種內(nèi)容編碼。同樣使用 q=[數(shù)值]
來(lái)表示相對(duì)優(yōu)先級(jí)。也可使用星號(hào)(*)作為通配符,指定任意的編碼格式。
Accept-Lanuage: zh-cn,zh;q=0.7,en=us,en;q=0.3
告知服務(wù)器用戶代理能夠處理的自然語(yǔ)言集(指中文或英文等),以及自然語(yǔ)言集的相對(duì)優(yōu)先級(jí),可一次性指定多種自然語(yǔ)言集。同樣使用 q=[數(shù)值]
來(lái)表示相對(duì)優(yōu)先級(jí)。
Authorization: Basic ldfKDHKfkDdasSAEdasd==
告知服務(wù)器用戶代理的認(rèn)證信息(證書值)。通常,想要通過(guò)服務(wù)器認(rèn)證的用戶代理會(huì)在接收到返回的 401 狀態(tài)碼響應(yīng)后,把首部字段 Authorization 加入請(qǐng)求中。共用緩存在接收到含有 Authorization 首部字段的請(qǐng)求時(shí)的操作處理會(huì)略有差異。
Expect: 100-continue
告知服務(wù)器客戶端期望出現(xiàn)的某種特定行為。
From: Deeson_Woo@163.com
告知服務(wù)器使用用戶代理的電子郵件地址。
Host: www.jianshu.com
Host:
。形如 If-xxx 這種樣式的請(qǐng)求首部字段,都可稱為條件請(qǐng)求。服務(wù)器接收到附帶條件的請(qǐng)求后,只有判斷指定條件為真時(shí),才會(huì)執(zhí)行請(qǐng)求。
If-Match: '123456'
412 Precondition Failed
的響應(yīng)。If-Modified-Since: Mon, 10 Jul 2017 15:50:06 GMT
304 Not Modified
的響應(yīng)。If-None-Match: '123456'
首部字段 If-None-Match 屬于附帶條件之一。它和首部字段 If-Match 作用相反。用于指定 If-None-Match 字段值的實(shí)體標(biāo)記(ETag)值與請(qǐng)求資源的 ETag 不一致時(shí),它就告知服務(wù)器處理該請(qǐng)求。
If-Range: '123456'
412 Precondition Failed
作為響應(yīng)返回,其目的是催促客戶端再次發(fā)送請(qǐng)求。這樣一來(lái),與使用首部字段 If-Range 比起來(lái),就需要花費(fèi)兩倍的功夫。If-Unmodified-Since: Mon, 10 Jul 2017 15:50:06 GMT
首部字段 If-Unmodified-Since 和首部字段 If-Modified-Since 的作用相反。它的作用的是告知服務(wù)器,指定的請(qǐng)求資源只有在字段值內(nèi)指定的日期時(shí)間之后,未發(fā)生更新的情況下,才能處理請(qǐng)求。如果在指定日期時(shí)間后發(fā)生了更新,則以狀態(tài)碼 412 Precondition Failed
作為響應(yīng)返回。
Max-Forwards: 10
通過(guò) TRACE 方法或 OPTIONS 方法,發(fā)送包含首部字段 Max-Forwards 的請(qǐng)求時(shí),該字段以十進(jìn)制整數(shù)形式指定可經(jīng)過(guò)的服務(wù)器最大數(shù)目。服務(wù)器在往下一個(gè)服務(wù)器轉(zhuǎn)發(fā)請(qǐng)求之前,Max-Forwards 的值減 1 后重新賦值。當(dāng)服務(wù)器接收到 Max-Forwards 值為 0 的請(qǐng)求時(shí),則不再進(jìn)行轉(zhuǎn)發(fā),而是直接返回響應(yīng)。
Proxy-Authorization: Basic dGlwOjkpNLAGfFY5
Range: bytes=5001-10000
206 Partial Content
的響應(yīng)。無(wú)法處理該范圍請(qǐng)求時(shí),則會(huì)返回狀態(tài)碼 200 OK
的響應(yīng)及全部資源。Referer: http://www.sample.com/index.html
首部字段 Referer 會(huì)告知服務(wù)器請(qǐng)求的原始資源的 URI。
TE: gzip, deflate; q=0.5
TE: trailers
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:13.0) Gecko/20100101
首部字段名 | 說(shuō)明 |
---|---|
Accept-Ranges | 是否接受字節(jié)范圍請(qǐng)求 |
Age | 推算資源創(chuàng)建經(jīng)過(guò)時(shí)間 |
ETag | 資源的匹配信息 |
Location | 令客戶端重定向至指定 URI |
Proxy-Authenticate | 代理服務(wù)器對(duì)客戶端的認(rèn)證信息 |
Retry-After | 對(duì)再次發(fā)起請(qǐng)求的時(shí)機(jī)要求 |
Server | HTTP 服務(wù)器的安裝信息 |
Vary | 代理服務(wù)器緩存的管理信息 |
WWW-Authenticate | 服務(wù)器對(duì)客戶端的認(rèn)證信息 |
Accept-Ranges: bytes
Age: 1200
ETag: 'usagi-1234'
ETag: W/'usagi-1234'
。Location: http://www.sample.com/sample.html
Proxy-Authenticate: Basic realm='Usagidesign Auth'
Retry-After: 180
503 Service Unavailable
響應(yīng),或 3xx Redirect 響應(yīng)一起使用。Server: Apache/2.2.6 (Unix) PHP/5.2.5
首部字段 Server 告知客戶端當(dāng)前服務(wù)器上安裝的 HTTP 服務(wù)器應(yīng)用程序的信息。不單單會(huì)標(biāo)出服務(wù)器上的軟件應(yīng)用名稱,還有可能包括版本號(hào)和安裝時(shí)啟用的可選項(xiàng)。
Vary: Accept-Language
WWW-Authenticate: Basic realm='Usagidesign Auth'
首部字段 WWW-Authenticate 用于 HTTP 訪問(wèn)認(rèn)證。它會(huì)告知客戶端適用于訪問(wèn)請(qǐng)求 URI 所指定資源的認(rèn)證方案(Basic 或是 Digest)和帶參數(shù)提示的質(zhì)詢(challenge)。
首部字段名 | 說(shuō)明 |
---|---|
Allow | 資源可支持的 HTTP 方法 |
Content-Encoding | 實(shí)體主體適用的編碼方式 |
Content-Language | 實(shí)體主體的自然語(yǔ)言 |
Content-Length | 實(shí)體主體的大小(單位:字節(jié)) |
Content-Location | 替代對(duì)應(yīng)資源的 URI |
Content-MD5 | 實(shí)體主體的報(bào)文摘要 |
Content-Range | 實(shí)體主體的位置范圍 |
Content-Type | 實(shí)體主體的媒體類型 |
Expires | 實(shí)體主體過(guò)期的日期時(shí)間 |
Last-Modified | 資源的最后修改日期時(shí)間 |
Allow: GET, HEAD
405 Method Not Allowed
作為響應(yīng)返回。與此同時(shí),還會(huì)把所有能支持的 HTTP 方法寫入首部字段 Allow 后返回。Content-Encoding: gzip
Content-Language: zh-CN
首部字段 Content-Language 會(huì)告知客戶端,實(shí)體主體使用的自然語(yǔ)言(指中文或英文等語(yǔ)言)。
Content-Length: 15000
首部字段 Content-Length 表明了實(shí)體主體部分的大?。▎挝皇亲止?jié))。對(duì)實(shí)體主體進(jìn)行內(nèi)容編碼傳輸時(shí),不能再使用 Content-Length首部字段。
Content-Location: http://www.sample.com/index.html
首部字段 Content-Location 給出與報(bào)文主體部分相對(duì)應(yīng)的 URI。和首部字段 Location 不同,Content-Location 表示的是報(bào)文主體返回資源對(duì)應(yīng)的 URI。
Content-MD5: OGFkZDUwNGVhNGY3N2MxMDIwZmQ4NTBmY2IyTY==
首部字段 Content-MD5 是一串由 MD5 算法生成的值,其目的在于檢查報(bào)文主體在傳輸過(guò)程中是否保持完整,以及確認(rèn)傳輸?shù)竭_(dá)。
Content-Range: bytes 5001-10000/10000
針對(duì)范圍請(qǐng)求,返回響應(yīng)時(shí)使用的首部字段 Content-Range,能告知客戶端作為響應(yīng)返回的實(shí)體的哪個(gè)部分符合范圍請(qǐng)求。字段值以字節(jié)為單位,表示當(dāng)前發(fā)送部分及整個(gè)實(shí)體大小。
Content-Type: text/html; charset=UTF-8
首部字段 Content-Type 說(shuō)明了實(shí)體主體內(nèi)對(duì)象的媒體類型。和首部字段 Accept 一樣,字段值用 type/subtype 形式賦值。參數(shù) charset 使用 iso-8859-1 或 euc-jp 等字符集進(jìn)行賦值。
Expires: Mon, 10 Jul 2017 15:50:06 GMT
Last-Modified: Mon, 10 Jul 2017 15:50:06 GMT
首部字段 Last-Modified 指明資源最終修改的時(shí)間。一般來(lái)說(shuō),這個(gè)值就是 Request-URI 指定資源被修改的時(shí)間。但類似使用 CGI 腳本進(jìn)行動(dòng)態(tài)數(shù)據(jù)處理時(shí),該值有可能會(huì)變成數(shù)據(jù)最終修改時(shí)的時(shí)間。
首部字段名 | 說(shuō)明 | 首部類型 |
---|---|---|
Set-Cookie | 開始狀態(tài)管理所使用的 Cookie 信息 | 響應(yīng)首部字段 |
Cookie | 服務(wù)器接收到的 Cookie 信息 | 請(qǐng)求首部字段 |
Set-Cookie: status=enable; expires=Mon, 10 Jul 2017 15:50:06 GMT; path=/;
下面的表格列舉了 Set-Cookie 的字段值。
屬性 | 說(shuō)明 |
---|---|
NAME=VALUE | 賦予 Cookie 的名稱和其值(必需項(xiàng)) |
expires=DATE | Cookie 的有效期(若不明確指定則默認(rèn)為瀏覽器關(guān)閉前為止) |
path=PATH | 將服務(wù)器上的文件目錄作為Cookie的適用對(duì)象(若不指定則默認(rèn)為文檔所在的文件目錄) |
domain=域名 | 作為 Cookie 適用對(duì)象的域名 (若不指定則默認(rèn)為創(chuàng)建 Cookie的服務(wù)器的域名) |
Secure | 僅在 HTTPS 安全通信時(shí)才會(huì)發(fā)送 Cookie |
HttpOnly | 加以限制,使 Cookie 不能被 JavaScript 腳本訪問(wèn) |
Cookie 的 path 屬性可用于限制指定 Cookie 的發(fā)送范圍的文件目錄。
Cookie 的 secure 屬性用于限制 Web 頁(yè)面僅在 HTTPS 安全連接時(shí),才可以發(fā)送 Cookie。
Cookie: status=enable
首部字段 Cookie 會(huì)告知服務(wù)器,當(dāng)客戶端想獲得 HTTP 狀態(tài)管理支持時(shí),就會(huì)在請(qǐng)求中包含從服務(wù)器接收到的 Cookie。接收到多個(gè) Cookie 時(shí),同樣可以以多個(gè) Cookie 形式發(fā)送。
HTTP 首部字段是可以自行擴(kuò)展的。所以在 Web 服務(wù)器和瀏覽器的應(yīng)用上,會(huì)出現(xiàn)各種非標(biāo)準(zhǔn)的首部字段。
以下是最為常用的首部字段。
X-Frame-Options: DENY
首部字段 X-Frame-Options 屬于 HTTP 響應(yīng)首部,用于控制網(wǎng)站內(nèi)容在其他 Web 網(wǎng)站的 Frame 標(biāo)簽內(nèi)的顯示問(wèn)題。其主要目的是為了防止點(diǎn)擊劫持(clickjacking)攻擊。首部字段 X-Frame-Options 有以下兩個(gè)可指定的字段值:
X-XSS-Protection: 1
首部字段 X-XSS-Protection 屬于 HTTP 響應(yīng)首部,它是針對(duì)跨站腳本攻擊(XSS)的一種對(duì)策,用于控制瀏覽器 XSS 防護(hù)機(jī)制的開關(guān)。首部字段 X-XSS-Protection 可指定的字段值如下:
DNT: 1
首部字段 DNT 屬于 HTTP 請(qǐng)求首部,其中 DNT 是 Do Not Track 的簡(jiǎn)稱,意為拒絕個(gè)人信息被收集,是表示拒絕被精準(zhǔn)廣告追蹤的一種方法。首部字段 DNT 可指定的字段值如下:
由于首部字段 DNT 的功能具備有效性,所以 Web 服務(wù)器需要對(duì) DNT做對(duì)應(yīng)的支持。
P3P: CP='CAO DSP LAW CURa ADMa DEVa TAIa PSAa PSDa IVAa IVDa OUR BUS IND
首部字段 P3P 屬于 HTTP 響應(yīng)首部,通過(guò)利用 P3P(The Platform for Privacy Preferences,在線隱私偏好平臺(tái))技術(shù),可以讓 Web 網(wǎng)站上的個(gè)人隱私變成一種僅供程序可理解的形式,以達(dá)到保護(hù)用戶隱私的目的。
要進(jìn)行 P3P 的設(shè)定,需按以下操作步驟進(jìn)行:
200 OK
,以 3 位數(shù)字和原因短語(yǔ)組成。數(shù)字中的第一位指定了響應(yīng)類別,后兩位無(wú)分類。200 OK
。類別 | 原因短語(yǔ) | |
---|---|---|
1xx | Informational(信息性狀態(tài)碼) | 接收的請(qǐng)求正在處理 |
2xx | Success(成功狀態(tài)碼) | 請(qǐng)求正常處理完畢 |
3xx | Redirection(重定向狀態(tài)碼) | 需要進(jìn)行附加操作以完成請(qǐng)求 |
4xx | Client Error(客戶端錯(cuò)誤狀態(tài)碼) | 服務(wù)器無(wú)法處理請(qǐng)求 |
5xx | Server Error(服務(wù)器錯(cuò)誤狀態(tài)碼) | 服務(wù)器處理請(qǐng)求出錯(cuò) |
我們可以自行改變 RFC2616 中定義的狀態(tài)碼或者服務(wù)器端自行創(chuàng)建狀態(tài)碼,只要遵守狀態(tài)碼的類別定義就可以了。
HTTP 狀態(tài)碼種類繁多,數(shù)量達(dá)幾十種。其中最常用的有以下 14 種,一起來(lái)看看。
表示從客戶端發(fā)來(lái)的請(qǐng)求在服務(wù)器端被正常處理了。
表示客戶端進(jìn)行了范圍請(qǐng)求,而服務(wù)器成功執(zhí)行了這部分的 GET 請(qǐng)求。響應(yīng)報(bào)文中包含由 Content-Range 首部字段指定范圍的實(shí)體內(nèi)容。
永久性重定向。表示請(qǐng)求的資源已被分配了新的 URI。以后應(yīng)使用資源現(xiàn)在所指的 URI。也就是說(shuō),如果已經(jīng)把資源對(duì)應(yīng)的 URI 保存為書簽了,這時(shí)應(yīng)該按 Location 首部字段提示的 URI 重新保存。
301 Moved Permanently
狀態(tài)碼相似,但 302 Found
狀態(tài)碼代表資源不是被永久移動(dòng),只是臨時(shí)性質(zhì)的。換句話說(shuō),已移動(dòng)的資源對(duì)應(yīng)的 URI 將來(lái)還有可能發(fā)生改變。303 See Othe
r 和 302 Found
狀態(tài)碼有著相同的功能,但 303 See Other
狀態(tài)碼明確表示客戶端應(yīng)采用 GET 方法獲取資源,這點(diǎn)與 302 Found
狀態(tài)碼有區(qū)別。304 Not Modified
狀態(tài)碼返回時(shí),不包含任何響應(yīng)的主體部分。304 Not Modified
雖然被劃分到 3xx 類別中,但和重定向沒(méi)有關(guān)系。臨時(shí)重定向。該狀態(tài)碼與 302 Found
有著相同的含義。
200 OK
一樣對(duì)待該狀態(tài)碼。401 Unauthorized
的響應(yīng)必須包含一個(gè)適用于被請(qǐng)求資源的 WWW-Authenticate 首部用以質(zhì)詢(challenge)用戶信息。表明對(duì)請(qǐng)求資源的訪問(wèn)被服務(wù)器拒絕了。服務(wù)器端沒(méi)有必要給出詳細(xì)的拒絕理由,當(dāng)然也可以在響應(yīng)報(bào)文的實(shí)體主體部分對(duì)原因進(jìn)行描述。
表明服務(wù)器上無(wú)法找到請(qǐng)求的資源。除此之外,也可以在服務(wù)器端拒絕請(qǐng)求且不想說(shuō)明理由的時(shí)候使用。
表明服務(wù)器端在執(zhí)行請(qǐng)求時(shí)發(fā)生了錯(cuò)誤。也可能是 Web 應(yīng)用存在的 bug 或某些臨時(shí)的故障。
表明服務(wù)器暫時(shí)處于超負(fù)載或正在進(jìn)行停機(jī)維護(hù),現(xiàn)在無(wú)法處理請(qǐng)求。如果事先得知解除以上狀況需要的時(shí)間,最好寫入 Retry-After 首部字段再返回給客戶端。
大家請(qǐng)仔細(xì)看看上面示例中,各個(gè)組成部分對(duì)應(yīng)的內(nèi)容。
接著,我們來(lái)看看報(bào)文和實(shí)體的概念。如果把 HTTP 報(bào)文想象成因特網(wǎng)貨運(yùn)系統(tǒng)中的箱子,那么 HTTP 實(shí)體就是報(bào)文中實(shí)際的貨物。
我們可以看到,上面示例右圖中深紅色框的內(nèi)容就是報(bào)文的實(shí)體部分,而藍(lán)色框的兩部分內(nèi)容分別就是實(shí)體首部和實(shí)體主體。而左圖中粉紅框內(nèi)容就是報(bào)文主體。
通常,報(bào)文主體等于實(shí)體主體。只有當(dāng)傳輸中進(jìn)行編碼操作時(shí),實(shí)體主體的內(nèi)容發(fā)生變化,才導(dǎo)致它和報(bào)文主體產(chǎn)生差異。
內(nèi)容編碼類型:
編碼方式 | 描述 |
---|---|
gzip | 表明實(shí)體采用 GNU zip 編碼 |
compress | 表明實(shí)體采用 Unix 的文件壓縮程序 |
deflate | 表明實(shí)體采用 zlib 的格式壓縮的 |
identity | 表明沒(méi)有對(duì)實(shí)體進(jìn)行編碼,當(dāng)沒(méi)有 Content-Encoding 首部字段時(shí),默認(rèn)采用此編碼方式 |
內(nèi)容編碼是對(duì)報(bào)文的主體進(jìn)行的可逆變換,是和內(nèi)容的具體格式細(xì)節(jié)緊密相關(guān)的。
傳輸編碼也是作用在實(shí)體主體上的可逆變換,但使用它們是由于架構(gòu)方面的原因,同內(nèi)容的格式無(wú)關(guān)。使用傳輸編碼是為了改變報(bào)文中的數(shù)據(jù)在網(wǎng)絡(luò)上傳輸?shù)姆绞健?/p>
分塊編碼把報(bào)文分割成若干已知大小的塊。塊之間是緊挨著發(fā)送的,這樣就不需要在發(fā)送之前知道整個(gè)報(bào)文的大小了。分塊編碼是一種傳輸編碼,是報(bào)文的屬性。
分塊編碼與持久連接
若客戶端與服務(wù)器端之間不是持久連接,客戶端就不需要知道它在讀取的主體的長(zhǎng)度,而只需要讀取到服務(wù)器關(guān)閉主體連接為止。
當(dāng)使用持久連接時(shí),在服務(wù)器寫主體之前,必須知道它的大小并在 Content-Length 首部中發(fā)送。如果服務(wù)器動(dòng)態(tài)創(chuàng)建內(nèi)容,就可能在發(fā)送之前無(wú)法知道主體的長(zhǎng)度。
分塊編碼為這種困難提供了解決方案,只要允許服務(wù)器把主體分塊發(fā)送,說(shuō)明每塊的大小就可以了。因?yàn)橹黧w是動(dòng)態(tài)創(chuàng)建的,服務(wù)器可以緩沖它的一部分,發(fā)送其大小和相應(yīng)的塊,然后在主體發(fā)送完之前重復(fù)這個(gè)過(guò)程。服務(wù)器可以用大小為 0 的塊作為主體結(jié)束的信號(hào),這樣就可以繼續(xù)保持連接,為下一個(gè)響應(yīng)做準(zhǔn)備。
來(lái)看看一個(gè)分塊編碼的報(bào)文示例:
MIME 中的 multipart(多部分)電子郵件報(bào)文中包含多個(gè)報(bào)文,它們合在一起作為單一的復(fù)雜報(bào)文發(fā)送。每一部分都是獨(dú)立的,有各自的描述其內(nèi)容的集,不同部分之間用分界字符串連接在一起。
相應(yīng)得,HTTP 協(xié)議中也采納了多部分對(duì)象集合,發(fā)送的一份報(bào)文主體內(nèi)可包含多種類型實(shí)體。
多部分對(duì)象集合包含的對(duì)象如下:
206 Partial Content
響應(yīng)報(bào)文包含了多個(gè)范圍的內(nèi)容時(shí)使用。假設(shè)你正在下載一個(gè)很大的文件,已經(jīng)下了四分之三,忽然網(wǎng)絡(luò)中斷了,那下載就必須重頭再來(lái)一遍。為了解決這個(gè)問(wèn)題,需要一種可恢復(fù)的機(jī)制,即能從之前下載中斷處恢復(fù)下載。要實(shí)現(xiàn)該功能,這就要用到范圍請(qǐng)求。
有了范圍請(qǐng)求, HTTP 客戶端可以通過(guò)請(qǐng)求曾獲取失敗的實(shí)體的一個(gè)范圍(或者說(shuō)一部分),來(lái)恢復(fù)下載該實(shí)體。當(dāng)然這有一個(gè)前提,那就是從客戶端上一次請(qǐng)求該實(shí)體到這一次發(fā)出范圍請(qǐng)求的時(shí)間段內(nèi),該對(duì)象沒(méi)有改變過(guò)。例如:
GET /bigfile.html HTTP/1.1Host: www.sample.comRange: bytes=20224-···
上面示例中,客戶端請(qǐng)求的是文檔開頭20224字節(jié)之后的部分。
HTTP 通信時(shí),除客戶端和服務(wù)器外,還有一些用于協(xié)助通信的應(yīng)用程序。如下列出比較重要的幾個(gè):代理、緩存、網(wǎng)關(guān)、隧道、Agent 代理。
HTTP 代理服務(wù)器是 Web 安全、應(yīng)用集成以及性能優(yōu)化的重要組成模塊。代理位于客戶端和服務(wù)器端之間,接收客戶端所有的 HTTP 請(qǐng)求,并將這些請(qǐng)求轉(zhuǎn)發(fā)給服務(wù)器(可能會(huì)對(duì)請(qǐng)求進(jìn)行修改之后再進(jìn)行轉(zhuǎn)發(fā))。對(duì)用戶來(lái)說(shuō),這些應(yīng)用程序就是一個(gè)代理,代表用戶訪問(wèn)服務(wù)器。
出于安全考慮,通常會(huì)將代理作為轉(zhuǎn)發(fā)所有 Web 流量的可信任中間節(jié)點(diǎn)使用。代理還可以對(duì)請(qǐng)求和響應(yīng)進(jìn)行過(guò)濾,安全上網(wǎng)或綠色上網(wǎng)。
瀏覽器第一次請(qǐng)求:
瀏覽器再次請(qǐng)求:
Web 緩存或代理緩存是一種特殊的 HTTP 代理服務(wù)器,可以將經(jīng)過(guò)代理傳輸?shù)某S梦臋n復(fù)制保存起來(lái)。下一個(gè)請(qǐng)求同一文檔的客戶端就可以享受緩存的私有副本所提供的服務(wù)了。客戶端從附近的緩存下載文檔會(huì)比從遠(yuǎn)程 Web 服務(wù)器下載快得多。
網(wǎng)關(guān)是一種特殊的服務(wù)器,作為其他服務(wù)器的中間實(shí)體使用。通常用于將 HTTP 流量轉(zhuǎn)換成其他的協(xié)議。網(wǎng)關(guān)接收請(qǐng)求時(shí)就好像自己是資源的源服務(wù)器一樣??蛻舳丝赡懿⒉恢雷约赫诟粋€(gè)網(wǎng)關(guān)進(jìn)行通信。
隧道是會(huì)在建立起來(lái)之后,就會(huì)在兩條連接之間對(duì)原始數(shù)據(jù)進(jìn)行盲轉(zhuǎn)發(fā)的 HTTP 應(yīng)用程序。HTTP 隧道通常用來(lái)在一條或多條 HTTP 連接上轉(zhuǎn)發(fā)非 HTTP 數(shù)據(jù),轉(zhuǎn)發(fā)時(shí)不會(huì)窺探數(shù)據(jù)。
HTTP 隧道的一種常見(jiàn)用途就是通過(guò) HTTP 連接承載加密的安全套接字層(SSL)流量,這樣 SSL 流量就可以穿過(guò)只允許 Web 流量通過(guò)的防火墻了。
Agent 代理是代表用戶發(fā)起 HTTP 請(qǐng)求的客戶端應(yīng)用程序。所有發(fā)布 Web 請(qǐng)求的應(yīng)用程序都是 HTTP Agent 代理。
下一篇文章:一篇文章帶你熟悉 TCP/IP 協(xié)議(網(wǎng)絡(luò)協(xié)議篇二)
聯(lián)系客服