協議森林05 我盡力 (IP協議詳解)

原文地址爲: 協議森林05 我盡力 (IP協議詳解)

作者:Vamei 出處:http://www.cnblogs.com/vamei 嚴禁任何形式轉載。

 

在粗略瞭解了IP接力IP地址後,我們再反過來,看一看IP協議的具體細節和設計哲學。

 

IPv4與IPv6頭部的對比

我們已經在IP接力中介紹過,一個IP包分爲頭部(header)和數據(payload/data)兩部分。頭部是爲了實現IP通信必須的附加信息,數據是IP通信所要傳送的信息。

 

黃色區域 (同名區域)

我們看到,三個黃色區域跨越了IPv4和IPv6。Version(4位)用來表明IP協議版本,是IPv4還是IPv6(IPv4, Version=0100; IPv6, Version=0110)。Source AdrresssDestination Address分別爲發出地和目的地的IP地址

 

藍色區域 (名字發生變動的區域)

Time to Live 存活時間(Hop Limit in IPv6)。Time to Live最初是表示一個IP包的最大存活時間:如果IP包在傳輸過程中超過Time to Live,那麼IP包就作廢。後來,IPv4的這個區域記錄一個整數(比如30),表示在IP包接力過程中最多經過30個路由接力,如果超過30個路由接力,那麼這個IP包就作廢。IP包每經過一個路由器,路由器就給Time to Live減一。當一個路由器發現Time to Live爲0時,就不再發送該IP包。IPv6中的Hop Limit區域記錄的也是最大路由接力數,與IPv4的功能相同。Time to Live/Hop Limit避免了IP包在互聯網中無限接力。

Type of Service 服務類型(Traffic Class in IPv6)。Type of Service最初是用來給IP包分優先級,比如語音通話需要實時性,所以它的IP包應該比Web服務的IP包有更高的優先級。然而,這個最初不錯的想法沒有被微軟採納。在Windows下生成的IP包都是相同的最高優先級,所以在當時造成Linux和Windows混合網絡中,Linux的IP傳輸會慢於Windows (僅僅是因爲Linux更加守規矩!)。後來,Type of Service被實際分爲兩部分:Differentiated Service Field (DS, 前6位)和Explicit Congestion Notification (ECN, 後2位),前者依然用來區分服務類型,而後者用於表明IP包途徑路由的交通狀況。IPv6的Traffic Class也被如此分成兩部分。通過IP包提供不同服務的想法,並針對服務進行不同的優化的想法已經產生很久了,但具體做法並沒有形成公認的協議。比如ECN區域,它用來表示IP包經過路徑的交通狀況。如果接收者收到的ECN區域顯示路徑上的很擁擠,那麼接收者應該作出調整。但在實際上,許多接收者都會忽視ECN所包含的信息。交通狀況的控制往往由更高層的比如TCP協議實現。

Protocol 協議(Next Header in IPv6)。Protocol用來說明IP包Payload部分所遵循的協議,也就是IP包之上的協議是什麼。它說明了IP包封裝的是一個怎樣的高層協議包(TCP? UDP?)。

Total Length, 以及IPv6中Payload Length的討論要和IHL區域放在一起,我們即將討論。

 

紅色區域 (IPv6中刪除的區域)

我們看一下IPv4和IPv6的長度信息。IPv4頭部的長度。在頭部的最後,是options。每個options有32位,是選填性質的區域。一個IPv4頭部可以完全沒有options區域。不考慮options的話,整個IPv4頭部有20 bytes(上面每行爲4 bytes)。但由於有options的存在,整個頭部的總長度是變動的。我們用IHL(Internet Header Length)來記錄頭部的總長度,用Total Length記錄整個IP包的長度。IPv6沒有options,它的頭部是固定的長度40 bytes,所以IPv6中並不需要IHL區域。Payload Length用來表示IPv6的數據部分的長度。整個IP包爲40 bytes + Payload Length。

IPv4中還有一個Header Checksum區域。這個checksum用於校驗IP包的頭部信息。Checksum與之前在小喇叭中提到的CRC算法並不相同。IPv6則沒有checksum區域。IPv6包的校驗依賴高層的協議來完成,這樣的好處是免去了執行checksum校驗所需要的時間,減小了網絡延遲 (latency)。

Identification, flagsfragment offset,這三個包都是爲碎片化(fragmentation)服務的。碎片化是指一個路由器將接收到的IP包分拆成多個IP包傳送,而接收這些「碎片」的路由器或者主機需要將「碎片」重新組合(reassembly)成一個IP包。不同的局域網所支持的最大傳輸單元(MTU, Maximum Transportation Unit)不同。如果一個IP包的大小超過了局域網支持的MTU,就需要在進入該局域網時碎片化傳輸(就好像方面面面餅太大了,必須掰碎才能放進碗裏)。碎片化會給路由器和網絡帶來很大的負擔。最好在IP包發出之前探測整個路徑上的最小MTU,IP包的大小不超過該最小MTU,就可以避免碎片化。IPv6在設計上避免碎片化。每一個IPv6局域網的MTU都必須大於等於1280 bytes。IPv6的默認發送IP包大小爲1280 bytes。

 

令人痛苦的碎片化

綠色區域 (IPv6新增區域)

Flow Label是IPv6中新增的區域。它被用來提醒路由器來重複使用之前的接力路徑。這樣IP包可以自動保持出發時的順序。這對於流媒體之類的應用有幫助。Flow label的進一步使用還在開發中。

 

「我盡力」

IP協議在產生時是一個鬆散的網絡,這個網絡由各個大學的局域網相互連接成的,由一羣碰頭垢面的Geek維護。所以,IP協議認爲自己所處的環境是不可靠(unreliable)的:諸如路由器壞掉、實驗室失火、某個PhD踢掉電纜之類的事情隨時會發生。

不靠譜的網絡

這樣的兇險環境下,IP協議提供的傳送只能是「我盡力」 (best effort)式的。所謂的「我盡力」,其潛臺詞是,如果事情出錯不要怪我,我只是答應了盡力,可沒保證什麼。所以,如果IP包傳輸過程中出現錯誤(比如checksum對不上,比如交通太繁忙,比如超過Time to Live),根據IP協議,你的IP包會直接被丟掉。Game Over, 不會再有進一步的努力來修正錯誤。Best effort讓IP協議保持很簡單的形態。更多的質量控制交給高層協議處理,IP協議只負責有效率的傳輸。

(多麼不負責任的郵遞系統)

「效率優先」也體現在IP包的順序(order)上。即使出發地和目的地保持不變,IP協議也不保證IP包到達的先後順序。我們已經知道,IP接力是根據routing table決定接力路線的。如果在連續的IP包發送過程中,routing table更新(比如有一條新建的捷徑出現),那麼後發出的IP包選擇走不一樣的接力路線。如果新的路徑傳輸速度更快,那麼後發出的IP包有可能先到。這就好像是多車道的公路上,每輛車都在不停變換車道,最終所有的車道都塞滿汽車。這樣可以讓公路利用率達到最大。

「插隊」

 

IPv6中的Flow Label可以建議路由器將一些IP包保持一樣的接力路徑。但這只是「建議」,路由器可能會忽略該建議。

 

Header Checksum算法

Header Checksum區域有16位。它是這樣獲得的,從header取得除checksum之外的0/1序列,比如:

9194 8073 0000 4000 4011 C0A8 0001 C0A8 00C7 (十六進制hex, 這是一個爲演示運算過程而設計的header)

按照十六位(也就是4位hex)分割整個序列。將分割後的各個4位hex累積相加。如果有超過16位的進位出現,則將進位加到後16位結果的最後一位:

  Binary                Hex

  1001000110010100      9194

+ 1000000001110011      8073

  ----------------

1 0001001000000111     11207

+                1

  ----------------

  0001001000001000      1208
上面的計算叫做one's complement sum。求得所有十六位數的和,

one's complement sum(4500, 0073, 0000, 4000, 4011, C0A8, 0001, C0A8, 00C7) = 1433

然後,將1433的每一位取反(0->1, 1->0), 就得到checksum:EBCC

這樣,我們的header就是:

9194 8073 0000 4000 4011 EBCC C0A8 0001 C0A8 00C7

IP包的接收方在接收到IP包之後,可以求上面各個16位數的one's complement sum,應該得到FFFF。如果不是FFFF,那麼header是不正確的,整個IP包會被丟棄。

(再次提醒,示例所用的IP header不是真實的header,它只是起演示算法的作用)

 

總結

每個網絡協議的形成都有其歷史原因。比如IP協議是爲了將各個分散的實驗室網絡連接起來。由於當時的網絡很小,所以IPv4(IPv4產生與70年代)的地址總量爲40億。儘管當時被認爲是很大的數字,但數字浪潮很快帶來了地址耗盡危機。IPv6的主要目的是增加IPv4的地址容量,但同時根據IPv4的經驗和新時代的技術進步進行改進,比如避免碎片化,比如取消checksum (由於高層協議TCP的廣泛使用)。網絡協議技術上並不複雜,更多的考量是政策性的

IP協議是"Best Effort"式的,IP傳輸是不可靠的。但這樣的設計成就了IP協議的效率。

 

歡迎繼續閱讀「協議森林」系列

 


轉載請註明本文地址: 協議森林05 我盡力 (IP協議詳解)