協議森林05 我盡力 (IP協議詳解)

時間 2021-01-20 標籤網絡協議詳解

作者：Vamei 出處：http://www.cnblogs.com/vamei 嚴禁任何形式轉載。

在粗略瞭解了IP接力和IP地址後，我們再反過來，看一看IP協議的具體細節和設計哲學。

IPv4與IPv6頭部的對比

我們已經在IP接力中介紹過，一個IP包分爲頭部(header)和數據(payload/data)兩部分。頭部是爲了實現IP通信必須的附加信息，數據是IP通信所要傳送的信息。

黃色區域 (同名區域)

我們看到，三個黃色區域跨越了IPv4和IPv6。Version(4位)用來表明IP協議版本，是IPv4還是IPv6(IPv4, Version=0100; IPv6, Version=0110)。Source Adrresss和Destination Address分別爲發出地和目的地的IP地址。

藍色區域（名字發生變動的區域）

Time to Live 存活時間(Hop Limit in IPv6)。Time to Live最初是表示一個IP包的最大存活時間：如果IP包在傳輸過程中超過Time to Live，那麼IP包就作廢。後來，IPv4的這個區域記錄一個整數(比如30)，表示在IP包接力過程中最多經過30個路由接力，如果超過30個路由接力，那麼這個IP包就作廢。IP包每經過一個路由器，路由器就給Time to Live減一。當一個路由器發現Time to Live爲0時，就不再發送該IP包。IPv6中的Hop Limit區域記錄的也是最大路由接力數，與IPv4的功能相同。Time to Live/Hop Limit避免了IP包在互聯網中無限接力。

Type of Service 服務類型(Traffic Class in IPv6)。Type of Service最初是用來給IP包分優先級，比如語音通話需要實時性，所以它的IP包應該比Web服務的IP包有更高的優先級。然而，這個最初不錯的想法沒有被微軟採納。在Windows下生成的IP包都是相同的最高優先級，所以在當時造成Linux和Windows混合網絡中，Linux的IP傳輸會慢於Windows (僅僅是因爲Linux更加守規矩！)。後來，Type of Service被實際分爲兩部分：Differentiated Service Field (DS, 前6位)和Explicit Congestion Notification (ECN, 後2位)，前者依然用來區分服務類型，而後者用於表明IP包途徑路由的交通狀況。IPv6的Traffic Class也被如此分成兩部分。通過IP包提供不同服務的想法，並針對服務進行不同的優化的想法已經產生很久了，但具體做法並沒有形成公認的協議。比如ECN區域，它用來表示IP包經過路徑的交通狀況。如果接收者收到的ECN區域顯示路徑上的很擁擠，那麼接收者應該作出調整。但在實際上，許多接收者都會忽視ECN所包含的信息。交通狀況的控制往往由更高層的比如TCP協議實現。

Protocol 協議(Next Header in IPv6)。Protocol用來說明IP包Payload部分所遵循的協議，也就是IP包之上的協議是什麼。它說明了IP包封裝的是一個怎樣的高層協議包(TCP? UDP?)。

Total Length, 以及IPv6中Payload Length的討論要和IHL區域放在一起，我們即將討論。

紅色區域 (IPv6中刪除的區域)

我們看一下IPv4和IPv6的長度信息。IPv4頭部的長度。在頭部的最後，是options。每個options有32位，是選填性質的區域。一個IPv4頭部可以完全沒有options區域。不考慮options的話，整個IPv4頭部有20 bytes(上面每行爲4 bytes)。但由於有options的存在，整個頭部的總長度是變動的。我們用IHL(Internet Header Length)來記錄頭部的總長度，用Total Length記錄整個IP包的長度。IPv6沒有options，它的頭部是固定的長度40 bytes，所以IPv6中並不需要IHL區域。Payload Length用來表示IPv6的數據部分的長度。整個IP包爲40 bytes + Payload Length。

IPv4中還有一個Header Checksum區域。這個checksum用於校驗IP包的頭部信息。Checksum與之前在小喇叭中提到的CRC算法並不相同。IPv6則沒有checksum區域。IPv6包的校驗依賴高層的協議來完成，這樣的好處是免去了執行checksum校驗所需要的時間，減小了網絡延遲 (latency)。

Identification, flags和fragment offset，這三個包都是爲碎片化(fragmentation)服務的。碎片化是指一個路由器將接收到的IP包分拆成多個IP包傳送，而接收這些「碎片」的路由器或者主機需要將「碎片」重新組合(reassembly)成一個IP包。不同的局域網所支持的最大傳輸單元(MTU, Maximum Transportation Unit)不同。如果一個IP包的大小超過了局域網支持的MTU，就需要在進入該局域網時碎片化傳輸(就好像方面面面餅太大了，必須掰碎才能放進碗裏)。碎片化會給路由器和網絡帶來很大的負擔。最好在IP包發出之前探測整個路徑上的最小MTU，IP包的大小不超過該最小MTU，就可以避免碎片化。IPv6在設計上避免碎片化。每一個IPv6局域網的MTU都必須大於等於1280 bytes。IPv6的默認發送IP包大小爲1280 bytes。

令人痛苦的碎片化

綠色區域 (IPv6新增區域)

Flow Label是IPv6中新增的區域。它被用來提醒路由器來重複使用之前的接力路徑。這樣IP包可以自動保持出發時的順序。這對於流媒體之類的應用有幫助。Flow label的進一步使用還在開發中。

「我盡力」

IP協議在產生時是一個鬆散的網絡，這個網絡由各個大學的局域網相互連接成的，由一羣碰頭垢面的Geek維護。所以，IP協議認爲自己所處的環境是不可靠(unreliable)的：諸如路由器壞掉、實驗室失火、某個PhD踢掉電纜之類的事情隨時會發生。

不靠譜的網絡

這樣的兇險環境下，IP協議提供的傳送只能是「我盡力」 (best effort)式的。所謂的「我盡力」，其潛臺詞是，如果事情出錯不要怪我，我只是答應了盡力，可沒保證什麼。所以，如果IP包傳輸過程中出現錯誤(比如checksum對不上，比如交通太繁忙，比如超過Time to Live)，根據IP協議，你的IP包會直接被丟掉。Game Over, 不會再有進一步的努力來修正錯誤。Best effort讓IP協議保持很簡單的形態。更多的質量控制交給高層協議處理，IP協議只負責有效率的傳輸。

(多麼不負責任的郵遞系統)

「效率優先」也體現在IP包的順序(order)上。即使出發地和目的地保持不變，IP協議也不保證IP包到達的先後順序。我們已經知道，IP接力是根據routing table決定接力路線的。如果在連續的IP包發送過程中，routing table更新(比如有一條新建的捷徑出現)，那麼後發出的IP包選擇走不一樣的接力路線。如果新的路徑傳輸速度更快，那麼後發出的IP包有可能先到。這就好像是多車道的公路上，每輛車都在不停變換車道，最終所有的車道都塞滿汽車。這樣可以讓公路利用率達到最大。

「插隊」

IPv6中的Flow Label可以建議路由器將一些IP包保持一樣的接力路徑。但這只是「建議」，路由器可能會忽略該建議。

Header Checksum算法

Header Checksum區域有16位。它是這樣獲得的，從header取得除checksum之外的0/1序列，比如：

9194 8073 0000 4000 4011 C0A8 0001 C0A8 00C7 (十六進制hex, 這是一個爲演示運算過程而設計的header)

按照十六位(也就是4位hex)分割整個序列。將分割後的各個4位hex累積相加。如果有超過16位的進位出現，則將進位加到後16位結果的最後一位：

Binary Hex

1001000110010100 9194

+ 1000000001110011 8073

----------------

1 0001001000000111 11207

+ 1

----------------

0001001000001000 1208
上面的計算叫做one's complement sum。求得所有十六位數的和，

one's complement sum(4500, 0073, 0000, 4000, 4011, C0A8, 0001, C0A8, 00C7) = 1433

然後，將1433的每一位取反(0->1, 1->0)，就得到checksum：EBCC

這樣，我們的header就是:

9194 8073 0000 4000 4011 EBCC C0A8 0001 C0A8 00C7

IP包的接收方在接收到IP包之後，可以求上面各個16位數的one's complement sum，應該得到FFFF。如果不是FFFF，那麼header是不正確的，整個IP包會被丟棄。

(再次提醒，示例所用的IP header不是真實的header，它只是起演示算法的作用)

總結

每個網絡協議的形成都有其歷史原因。比如IP協議是爲了將各個分散的實驗室網絡連接起來。由於當時的網絡很小，所以IPv4(IPv4產生與70年代)的地址總量爲40億。儘管當時被認爲是很大的數字，但數字浪潮很快帶來了地址耗盡危機。IPv6的主要目的是增加IPv4的地址容量，但同時根據IPv4的經驗和新時代的技術進步進行改進，比如避免碎片化，比如取消checksum (由於高層協議TCP的廣泛使用)。網絡協議技術上並不複雜，更多的考量是政策性的。

IP協議是"Best Effort"式的，IP傳輸是不可靠的。但這樣的設計成就了IP協議的效率。

歡迎繼續閱讀「協議森林」系列

轉載請註明本文地址：協議森林05 我盡力 (IP協議詳解)