回覆列表
-
1 # 南風微涼南巷茶色
-
2 # 使用者4912889400776
http的全稱是HyperText Transfer Protocol。
超文字傳輸協議(HTTP,HyperText Transfer Protocol)是網際網路上應用最為廣泛的一種網路協議。所有的WWW檔案都必須遵守這個標準。設計HTTP最初的目的是為了提供一種釋出和接收HTML頁面的方法。1960年美華人Ted Nelson構思了一種透過計算機處理文字資訊的方法,並稱之為超文字(hypertext),這成為了HTTP超文字傳輸協議標準架構的發展根基。Ted Nelson組織協調全球資訊網協會(World Wide Web Consortium)和網際網路工程工作小組(Internet Engineering Task Force )共同合作研究,最終釋出了一系列的RFC,其中著名的RFC 2616定義了HTTP 1.1。
WWW的核心——HTTP協議
眾所周知,Internet的基本協議是TCP/IP協議,目前廣泛採用的FTP、ArchieGopher等是建立在TCP/IP協議之上的應用層協議,不同的協議對應著不同的應用。WWW伺服器使用的主要協議是HTTP協議,即超文體傳輸協議。由於HTTP協議支援的服務不限於WWW,還可以是其它服務,因而HTTP協議允許使用者在統一的介面下,採用不同的協議訪問不同的服務,如FTP、Archie、SMTP、NNTP等。另外,HTTP協議還可用於名字伺服器和分散式物件管理。
2.1HTTP協議簡介
HTTP是一個屬於應用層的面向物件的協議,由於其簡捷、快速的方式,適用於分散式超媒體資訊系統。它於1990年提出,經過幾年的使用與發展,得到不斷地完善和擴充套件。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規範化工作正在進行之中,而且HTTP-NG(NextGenerationofHTTP)的建議已經提出。
HTTP協議的主要特點可概括如下:
1.支援客戶/伺服器模式。
2.簡單快速:客戶向伺服器請求服務時,只需傳送請求方法和路徑。請求方法常用的有GET、HEAD、POST。每種方法規定了客戶與伺服器聯絡的型別不同。
由於HTTP協議簡單,使得HTTP伺服器的程式規模小,因而通訊速度很快。
3.靈活:HTTP允許傳輸任意型別的資料物件。正在傳輸的型別由Content-Type加以標記。
4.無連線:無連線的含義是限制每次連線只處理一個請求。伺服器處理完客戶的請求,並收到客戶的應答後,即斷開連線。採用這種方式可以節省傳輸時間。
5.無狀態:HTTP協議是無狀態協議。無狀態是指協議對於事務處理沒有記憶能力。缺少狀態意味著如果後續處理需要前面的資訊,則它必須重傳,這樣可能導致每次連線傳送的資料量增大。另一方面,在伺服器不需要先前資訊時它的應答就較快。
2.2HTTP協議的幾個重要概念
1.連線(Connection):一個傳輸層的實際環流,它是建立在兩個相互通訊的應用程式之間。
2.訊息(Message):HTTP通訊的基本單位,包括一個結構化的八元組序列並透過連線傳輸。
3.請求(Request):一個從客戶端到伺服器的請求資訊包括應用於資源的方法、資源的識別符號和協議的版本號
4.響應(Response):一個從伺服器返回的資訊包括HTTP協議的版本號、請求的狀態(例如“成功”或“沒找到”)和文件的MIME型別。
5.資源(Resource):由URI標識的網路資料物件或服務。
6.實體(Entity):資料資源或來自服務資源的回映的一種特殊表示方法,它可能被包圍在一個請求或響應資訊中。一個實體包括實體頭資訊和實體的本身內容。
7.客戶機(Client):一個為傳送請求目的而建立連線的應用程式。
8.使用者代理(Useragent):初始化一個請求的客戶機。它們是瀏覽器、編輯器或其它使用者工具。
9.伺服器(Server):一個接受連線並對請求返回資訊的應用程式。
10.源伺服器(Originserver):是一個給定資源可以在其上駐留或被建立的伺服器。
11.代理(Proxy):一箇中間程式,它可以充當一個伺服器,也可以充當一個客戶機,為其它客戶機建立請求。請求是透過可能的翻譯在內部或經過傳遞到其它的伺服器中。一個代理在傳送請求資訊之前,必須解釋並且如果可能重寫它。
代理經常作為透過防火牆的客戶機端的門戶,代理還可以作為一個幫助應用來透過協議處理沒有被使用者代理完成的請求。
12.閘道器(Gateway):一個作為其它伺服器中間媒介的伺服器。與代理不同的是,閘道器接受請求就好象對被請求的資源來說它就是源伺服器;發出請求的客戶機並沒有意識到它在同閘道器打交道。
閘道器經常作為透過防火牆的伺服器端的門戶,閘道器還可以作為一個協議翻譯器以便存取那些儲存在非HTTP系統中的資源。
13.通道(Tunnel):是作為兩個連線中繼的中介程式。一旦啟用,通道便被認為不屬於HTTP通訊,儘管通道可能是被一個HTTP請求初始化的。當被中繼的連線兩端關閉時,通道便消失。當一個門戶(Portal)必須存在或中介(Intermediary)不能解釋中繼的通訊時通道被經常使用。
14.快取(Cache):反應資訊的局域儲存。
2.3HTTP協議的運作方式
HTTP協議是基於請求/響應正規化的。一個客戶機與伺服器建立連線後,傳送一個請求給伺服器,請求方式的格式為,統一資源識別符號、協議版本號,後邊是MIME資訊包括請求修飾符、客戶機資訊和可能的內容。伺服器接到請求後,給予相應的響應資訊,其格式為一個狀態行包括資訊的協議版本號、一個成功或錯誤的程式碼,後邊是MIME資訊包括伺服器資訊、實體資訊和可能的內容。
許多HTTP通訊是由一個使用者代理初始化的並且包括一個申請在源伺服器上資源的請求。最簡單的情況可能是在使用者代理(UA)和源伺服器(O)之間透過一個單獨的連線來完成(見圖2-1)。
圖2-1
當一個或多箇中介出現在請求/響應鏈中時,情況就變得複雜一些。中介由三種:代理(Proxy)、閘道器(Gateway)和通道(Tunnel)。一個代理根據URI的絕對格式來接受請求,重寫全部或部分訊息,透過URI的標識把已格式化過的請求傳送到伺服器。閘道器是一個接收代理,作為一些其它伺服器的上層,並且如果必須的話,可以把請求翻譯給下層的伺服器協議。一個通道作為不改變訊息的兩個連線之間的中繼點。當通訊需要透過一箇中介(例如:防火牆等)或者是中介不能識別訊息的內容時,通道經常被使用。圖2-2
上面的圖2-2表明了在使用者代理(UA)和源伺服器(O)之間有三個中介(A,B和C)。一個透過整個鏈的請求或響應訊息必須經過四個連線段。這個區別是重要的,因為一些HTTP通訊選擇可能應用於最近的連線、沒有通道的鄰居,應用於鏈的終點或應用於沿鏈的所有連線。儘管圖2-2是線性的,每個參與者都可能從事多重的、併發的通訊。例如,B可能從許多客戶機接收請求而不透過A,並且/或者不透過C把請求送到A,在同時它還可能處理A的請求。
任何針對不作為通道的匯聚可能為處理請求啟用一個內部快取。快取的效果是請求/響應鏈被縮短,條件是沿鏈的參與者之一具有一個快取的響應作用於那個請求。下圖說明結果鏈,其條件是針對一個未被UA或A加快取的請求,B有一個經過C來自O的一個前期響應的快取複製。
圖2-3
在Internet上,HTTP通訊通常發生在TCP/IP連線之上。預設埠是TCP80,但其它的埠也是可用的。但這並不預示著HTTP協議在Internet或其它網路的其它協議之上才能完成。HTTP只預示著一個可靠的傳輸。
以上簡要介紹了HTTP協議的宏觀運作方式,下面介紹一下HTTP協議的內部操作過程。
首先,簡單介紹基於HTTP協議的客戶/伺服器模式的資訊交換過程,如圖2-4所示,它分四個過程,建立連線、傳送請求資訊、傳送響應資訊、關閉連線。
圖2-4
在WWW中,“客戶”與“伺服器”是一個相對的概念,只存在於一個特定的連線期間,即在某個連線中的客戶在另一個連線中可能作為伺服器。WWW伺服器執行時,一直在TCP80埠(WWW的預設埠)監聽,等待連線的出現。
下面,討論HTTP協議下客戶/伺服器模式中資訊交換的實現。1.建立連線連線的建立是透過申請套接字(Socket)實現的。客戶開啟一個套接字並把它約束在一個埠上,如果成功,就相當於建立了一個虛擬檔案。以後就可以在該虛擬檔案上寫資料並透過網路向外傳送。
2.傳送請求
開啟一個連線後,客戶機把請求訊息送到伺服器的停留埠上,完成提出請求動作。
HTTP/1.0請求訊息的格式為:
請求訊息=請求行(通用資訊|請求頭|實體頭)CRLF[實體內容]
請求行=方法請求URLHTTP版本號CRLF
方法=GET|HEAD|POST|擴充套件方法
URL=協議名稱+宿主名+目錄與檔名
請求行中的方法描述指定資源中應該執行的動作,常用的方法有GET、HEAD和POST。不同的請求物件對應GET的結果是不同的,對應關係如下:
物件GET的結果
檔案檔案的內容
程式該程式的執行結果
資料庫查詢查詢結果
HEAD——要求伺服器查詢某物件的元資訊,而不是物件本身。
POST——從客戶機向伺服器傳送資料,在要求伺服器和CGI做進一步處理時會用到POST方法。POST主要用於傳送HTML文字中FORM的內容,讓CGI程式處理。
一個請求的例子為:
GEThttp://networking.zju.edu.cn/zju/index.htmHTTP/1.0
頭資訊又稱為元資訊,即資訊的資訊,利用元資訊可以實現有條件的請求或應答。
請求頭——告訴伺服器怎樣解釋本次請求,主要包括使用者可以接受的資料型別、壓縮方法和語言等。
實體頭——實體資訊型別、長度、壓縮方法、最後一次修改時間、資料有效期等。
實體——請求或應答物件本身。
3.傳送響應
伺服器在處理完客戶的請求之後,要向客戶機發送響應訊息。
HTTP/1.0的響應訊息格式如下:
響應訊息=狀態行(通用資訊頭|響應頭|實體頭)CRLF〔實體內容〕
狀態行=HTTP版本號狀態碼原因敘述
狀態碼錶示響應型別
1××保留
2××表示請求成功地接收
3××為完成請求客戶需進一步細化請求
4××客戶錯誤
5××伺服器錯誤
響應頭的資訊包括:服務程式名,通知客戶請求的URL需要認證,請求的資源何時能使用。
4.關閉連線
客戶和伺服器雙方都可以透過關閉套接字來結束TCP/IP對話