最近一段時間以來,關於HTTP/3的新聞有很多,越來越多的國際大公司已經開始使用HTTP/3了。
所以,HTTP/3已經是箭在弦上了,全面使用只是個時間問題,那麼,作為一線開發者,我們也是時候瞭解下到底什麼是HTTP/3,為什麼需要HTTP/3了。
於是,我準備開始寫這篇文章,但是要想把HTTP/3的事情說清楚,一定繞不過的問題就是HTTP/2,所以寫著寫著,篇幅越來越多,於是我就把他們分成了上下兩篇。
這一篇我們主要來回顧下HTTP/2,然後再來重點看一下HTTP/2存在哪些問題,為什麼要被棄用。
HTTP/2 輝煌不在?雖然HTTP/2標準在2015年5月就以RFC 7540正式發表了,並且多數瀏覽器在2015年底就支援了。
但是,真正被廣泛使用起來要到2018年左右,但是也是在2018年,11月IETF給出了官方批准,認可HTTP-over-QUIC成為HTTP/3。
2018年的時候,我寫過一篇文章介紹《HTTP/2到底是什麼?》,那時候HTTP/2還是個新技術,剛剛開始有軟體支援,短短兩年過去了,現在HTTP/3已經悄然而至了。
**根據W3Techs的資料,截至2019年6月,全球也僅有36.5%的網站支援了HTTP/2。**所以,可能很多網站還沒開始支援HTTP/2,HTTP/3就已經來了。
所以,對於很多網站來說,或許直接升級HTTP/3是一個更加正確的選擇。
當你讀到這裡的時候,我預設大家對HTTP/2有了一定的基本瞭解。
我們知道,HTTP/2的誕生,主要是為了解決HTTP/1.1中的效率問題,HTTP/2中最核心的技術就是多路複用技術,即允許同時透過單一的HTTP/2.0連線發起多重的請求-響應訊息。
同時還實現了二進位制分幀、header壓縮、服務端推送等技術。
從HTTP/1.0誕生,一直到HTTP/2,在這24年裡,HTTP協議已經做過了三次升級,但是有一個關鍵的技術點是不變的,那就是這所有的HTTP協議,都是基於TCP協議實現的。
流水的HTTP,鐵打的TCP。這是因為相對於UDP協議,TCP協議更加可靠。
雖然在HTTP/1.1的基礎上推出HTTP/2大大的提升了效率,但是還是有很多人認為這只是個"臨時方案",這也是為什麼剛剛推出沒多久,業內就開始大力投入HTTP/3的研發與推廣了。
而這背後的深層次原因也正是因為他還是基於TCP協議實現的。TCP協議雖然更加可靠,但是還是存在著一定的問題,接下來具體分析下。
HTTP/2 問題隊頭阻塞隊頭阻塞翻譯自英文head-of-line blocking,這個詞並不新鮮,因為早在HTTP/1.1時代,就一直存在著隊頭阻塞的問題。
但是很多人在一些資料中會看到有論點說HTTP/2解決了隊頭阻塞的問題。但是這句話只對了一半。
只能說HTTP/2解決了HTTP的隊頭阻塞問題,但是並沒有解決TCP隊頭阻塞問題!
如果大家對於HTTP的歷史有一定的瞭解的話,就會知道。HTTP/1.1相比較於HTTP/1.0來說,最主要的改進就是引入了持久連線(keep-alive)。
所謂的持久連線就是:在一個TCP連線上可以傳送多個HTTP請求和響應,減少了建立和關閉連線的消耗和延遲。
引入了持久連線之後,在效能方面,HTTP協議有了明顯的提升。
另外,HTTP/1.1允許在持久連線上使用請求管道,是相對於持久連線的又一效能最佳化。
所謂請求管道,就是在HTTP響應到達之前,可以將多條請求放入佇列,當第一條HTTP請求透過網路流向伺服器時,第二條和第三條請求也可以開始傳送了。在高時延網路條件下,這樣做可以降低網路的環回時間,提高效能。
但是,對於管道連線還是有一定的限制和要求的,其中一個比較關鍵的就是服務端必須按照與請求相同的順序回送HTTP響應。
這也就意味著,如果一個響應返回發生了延遲,那麼其後續的響應都會被延遲,直到隊頭的響應送達。這就是所謂的HTTP隊頭阻塞。
但是HTTP隊頭阻塞的問題在HTTP/2中得到了有效的解決。HTTP/2廢棄了管道化的方式,而是創新性的引入了幀、訊息和資料流等概念。客戶端和伺服器可以把 HTTP 訊息分解為互不依賴的幀,然後亂序傳送,最後再在另一端把它們重新組合起來。
因為沒有順序了,所以就不需要阻塞了,就有效的解決了HTTP對隊頭阻塞的問題。
但是,HTTP/2仍然會存在TCP隊頭阻塞的問題,那是因為HTTP/2其實還是依賴TCP協議實現的。
TCP傳輸過程中會把資料拆分為一個個按照順序排列的資料包,這些資料包透過網路傳輸到了接收端,接收端再按照順序將這些資料包組合成原始資料,這樣就完成了資料傳輸。
但是如果其中的某一個數據包沒有按照順序到達,接收端會一直保持連線等待資料包返回,這時候就會阻塞後續請求。這就發生了TCP隊頭阻塞。
HTTP/1.1的管道化持久連線也是使得同一個TCP連結可以被多個HTTP使用,但是HTTP/1.1中規定一個域名可以有6個TCP連線。而HTTP/2中,同一個域名只是用一個TCP連線。
所以,在HTTP/2中,TCP隊頭阻塞造成的影響會更大,因為HTTP/2的多路複用技術使得多個請求其實是基於同一個TCP連線的,那如果某一個請求造成了TCP隊頭阻塞,那麼多個請求都會受到影響。
TCP握手時長一提到TCP協議,大家最先想到的一定是他的三次握手與四次關閉的特性。
因為TCP是一種可靠通訊協議,而這種可靠就是靠三次握手實現的,透過三次握手,TCP在傳輸過程中可以保證接收方收到的資料是完整,有序,無差錯的。
但是,問題是三次握手是需要消耗時間的,這裡插播一個關於網路延遲的概念。
網路延遲又稱為 RTT(Round Trip Time)。他是指一個請求從客戶端瀏覽器傳送一個請求資料包到伺服器,再從伺服器得到響應資料包的這段時間。RTT 是反映網路效能的一個重要指標。
我們知道,TCP三次握手的過程客戶端和伺服器之間需要互動三次,那麼也就是說需要消耗1.5 RTT。
另外,如果使用的是安全的HTTPS協議,就還需要使用TLS協議進行安全資料傳輸,這個過程又要消耗一個RTT(TLS不同版本的握手機制不同,這裡按照最小的消耗來算)
那麼也就是說,一個純HTTP/2的連線,需要消耗1.5個RTT,如果是一個HTTPS連線,就需要消耗3-4個RTT。
而具體消耗的時長根據伺服器和客戶端之間的距離則不盡相同,如果比較近的話,消耗在100ms以內,對於用來說可能沒什麼感知,但是如果一個RTT的耗時達到300-400ms,那麼,一次連線建立過程總耗時可能要達到一秒鐘左右,這時候,使用者就會明顯的感知到網頁載入很慢。
升級TCP是否可行?基於上面我們提到的這些問題,很多人提出來說:既然TCP存在這些問題,並且我們也知道這些問題的存在,甚至解決方案也不難想到,為什麼不能對協議本身做一次升級,解決這些問題呢?
其實,這就涉及到一個"協議僵化"的問題。
這樣講,我們在網際網路上瀏覽資料的時候,資料的傳輸過程其實是極其複雜的。
我們知道的,想要在家裡使用網路有幾個前提,首先我們要透過執行商開通網路,並且需要使用路由器,而路由器就是網路傳輸過程中的一箇中間裝置。
中間裝置是指插入在資料終端和訊號轉換裝置之間,完成調製前或解調後某些附加功能的輔助裝置。例如集線器、交換機和無線接入點、路由器、安全解調器、通訊伺服器等都是中間裝置。
如果TCP協議需要升級,那麼意味著需要這些中間裝置都能支援新的特性,我們知道路由器我們可以重新換一個,但是其他的那些中間裝置呢?尤其是那些比較大型的裝置呢?更換起來的成本是巨大的。
而且,除了中間裝置之外,作業系統也是一個重要的因素,因為TCP協議需要透過作業系統核心來實現,而作業系統的更新也是非常滯後的。
所以,這種問題就被稱之為"中間裝置僵化",也是導致"協議僵化"的重要原因。這也是限制著TCP協議更新的一個重要原因。
所以,近些年來,由IETF標準化的許多TCP新特性都因缺乏廣泛支援而沒有得到廣泛的部署或使用!
放棄TCP?上面提到的這些問題的根本原因都是因為HTTP/2是基於TPC實現導致的,而TCP協議自身的升級又是很難實現的。
那麼,剩下的解決辦法就只有一條路,那就是放棄TCP協議。
放棄TCP的話,就又有兩個新的選擇,是使用其他已有的協議,還是重新創造一個協議呢?
看到這裡,聰明的讀者一定也想到了,創造新的協議一樣會受到中間裝置僵化的影響。近些年來,因為在網際網路上部署遭遇很大的困難,創造新型傳輸層協議的努力基本上都失敗了!
所以,想要升級新的HTTP協議,那麼就只剩一條路可以走了,那就是基於已有的協議做一些改造和支援,UDP就是一個絕佳的選擇了。
總結因為HTTP/2底層是採用TCP協議實現的,雖然解決了HTTP隊頭阻塞的問題,但是對於TCP隊頭阻塞的問題卻無能為力。
TCP傳輸過程中會把資料拆分為一個個按照順序排列的資料包,這些資料包透過網路傳輸到了接收端,接收端再按照順序將這些資料包組合成原始資料,這樣就完成了資料傳輸。
但是如果其中的某一個數據包沒有按照順序到達,接收端會一直保持連線等待資料包返回,這時候就會阻塞後續請求。這就發生了TCP隊頭阻塞。
另外,TCP這種可靠傳輸是靠三次握手實現的,TCP三次握手的過程客戶端和伺服器之間需要互動三次,那麼也就是說需要消耗1.5 RTT。如果是HTTPS那麼消耗的RTT就更多。
而因為很多中間裝置比較陳舊,更新換代成本巨大,這就導致TCP協議升級或者採用新的協議基本無法實現。
所以,HTTP/3選擇了一種新的技術方案,那就是基於UDP做改造,這種技術叫做QUIC。
那麼問題來了,HTTP/3是如何使用的UDP呢?做了哪些改造?如何保證連線的可靠性?UDP協議就沒有僵化的問題了嗎?