网络层
功能概述
主要任务是把分组从源端传到目的端,为分组交换网上的不同主机提供通信服务
网络层传输单位是数据报
功能
- 路由选择与分组转发
- 异构网络互联
- 拥塞控制:开环控制(静态),闭环控制(动态)
IP数据报格式
- 1B=8b
- 版本:IPv4/IPv6
- 首部长度:单位是4B,最小为5
- 区分服务:指示期望获得哪种类型的服务
- 总长度:首部+数据,单位是1B
- 生存空间(TTL): IP分组的保质期。经过一个路由-1,变成0则丢弃
- 协议:数据部分的协议
- 首部校验和:只校验首部
- 源IP地址和目的IP地址:3892位
- 可选字段:0~40B,用来支持排错、测量以及安全措施
- 填充:全0,把首部补成4B的整数倍
数据部分的协议
协议名 | ICMP | IGMP | TCP | EGP | IGP | UDP | IPv6 | ESP | OSPF |
---|---|---|---|---|---|---|---|---|---|
字段值 | 1 | 2 | 6 | 8 | 9 | 17 | 41 | 50 | 89 |
IP数据报分片
最大传送单元MTU
链路层数据帧可封装数据的上限
以太网的MTU时1500字节
如果传输的数据报长度大于MTU,就需要分片
数据报格式
标识:同一数据报的分片使用同一标识
标志:只有2位有意义:DF,MF
中间位DF(Don’t Fragment):DF=1,禁止分片;DF=0,允许分片
最低位MF(More Fragment):MF=1,后面还有分片;MF=0,代表最后一片/没有分片
片偏移:指出较长分组分片后,某分片在原分组中的相对位置(以8B为单位,除了最后一个分片,每个分片长度一定是8B的整数倍)
单位:总长度单位是1B,片偏移单位是8B,首部长度单位是4B
IPv4地址
IP编址的历史阶段
分类的IP地址
子网划分
构成超网(五分类编址方法)
分类的IP地址
IP地址:全世界唯一的32位/4字节标识符,标识路由器主机的接口
IP地址:={<网络号>,<主机号>}
网络类别 | 最大可用网络数 | 第一个可用的网络号 | 最后一个可用的网络号 | 每个网络中最大的主机数 |
---|---|---|---|---|
A | $2^7-2$ | 1 | 126 | $2^{24} - 2$ |
B | $2^{14}-1$ | 128.1 | 191.255 | $2^{16}-2$ |
C | $2^{21}-1$ | 192.0.1 | 223.255.255 | $2^8-1$ |
网络地址转换(NAT)
Network Address Translation,在专用网连接到因特网的路由器上安装NAT软件,安装了NAT软件的路由器叫NAT路由器,它至少有一个有效的外部全球IP地址
子网划分和子网掩码
分类的IP地址的弱点
IP地址空间的利用率有时很低
两级IP地址不够灵活
子网划分
某单位划分子网后,对外仍表现为一个网络,即本单位外的网络看不见本单位内子网的划分
两级IP地址:网络号+主机号
三级IP地址:网络号+子网号+主机号
子网掩码
两级IP地址:145.13.3.10
两级IP地址的子网掩码:255.255.0.0
三级IP地址:145.13.3.10
三级IP地址的子网掩码:255.255.255.0
子网的网络地址:145.13.3.0(IP地址和子网掩码与操作)
使用子网时分组的转发
路由表中
目的网络地址
目的网络子网掩码
下一跳地址
路由器转发分组的算法
提取目的IP地址
是否直接嚼服(逐位相与)
特定主机路由
检测路由表中有无路径(逐位相与)
默认路由0.0.0.0(回到第一步循环)
丢弃,报告转发分组出错
无分类编址CIDR
为什么使用CIDR:B类地址很快将分配完毕,路由表中的项目急剧增长
CIDR的特点
消除了传统A类,B类和C类地址以及划分子网的概念
融合子网地址与子网掩码,方便子网划分
CIDR把网络前缀相同的连续的IP地址组成一个CIDR地址块。如128.14.35.7/20是某CIDR地址块中的一个地址,20表示网络前缀长度
两级IP地址:网络号+主机号
三级IP地址:网络号+子网号+主机号
CIDR地址:网络前缀(网络号+子网号) + 主机号
构成超网
将多个子网聚合成一个较大的子网,叫做构成超网,或路由聚合
方法:将网络前缀缩短(所有网络地址取交集)
最长前缀匹配
使用CIDR时,查找路由表可能得到几个匹配结果(跟网络掩码按位相与),应选择具有最长网络前缀的路由
前缀越长,地址块越小,路由越具体
ARP协议
发送数据过程
为什么要使用ARP协议
由于在实际网络的链路上传送数据帧时,最终必须使用MAC地址
ARP协议王城主机或路由IP地址到MAC地址的映射(解决下一跳走哪的问题)
ARP协议是自动进行的
ARP协议使用过程
检查ARP高速缓存,有对应表则写入MAC帧
没有则用目的MAC地址为FF-FF-FF-FF-FF-FF的帧封装并广播ARP请求分组,同一局域网中所有主机都能收到该请求
目的主机收到请求后就会向源主机单播一个ARP响应分组,源主机收到后,将此映射写入ARP高速缓存(10~20min更新一次)
ARP协议4种典型情况
- 主机A发送给本网络上的主机B:用ARP找到主机B的硬件地址
- 主机A发送给另一网络上的主机B:用ARP找到本网络上一个路由器(网关)的硬件地址
- 路由器发给本网络的主机A:用ARP找到主机A的硬件地址
- 路由器发给另一网络的主机B:用ARP找到本网络上的一个路由器的硬件地址
DHCP协议
主机如何获得IP地址
静态配置:IP地址,子网掩码,默认网关
动态配置:用DHCP服务器来分配IP
定义
动态主机配置协议DHCP是应用层协议,使用客户/服务器方式,客户端和服务端通过广播方式进行交互,基于UDP
DHCP提供即插即用的联网机制,主机可以葱服务器动态获取IP地址,子网掩码,默认网关,DNS服务器名称和IP地址。允许地址重用,支持移动用户加入网络,支持在用地址续租
工作流程
主机广播DHCP发现报文(试图找到网络中的服务器,服务器获得一个IP地址)
DHCP服务器广播DHCP提供报文(服务器拟分配给主机一个IP地址及相关配置,先到先得)
主机广播DHCP请求报文(主机向服务器请求提供IP地址)
DHCP服务器广播DHCP确认报文(正式将IP地址分配给主机)
ICMP协议
ICMP差错报文(五种)
终点不可达:当路由器或主机不能交付数据报时,就向源点发送终点不可达报文(无法交付)
源点抑制:当路由器或主机由于拥塞而丢弃数据报时,就向源点发送源点抑制报文,使源点知道应当把数据报的发送速率放慢。(拥塞丢数据,现在已经被遗弃了)
时间超过:当路由器收到生存时间TTL=0的数据报时,除丢弃该数据报外,还要向源点发送时间超过报文。当终点在预先规定的时间内不能收到以个数报的全部数据报片时,就把已收到的数据片都丢弃,并向源点发送时间超过报文(TTL=0)
参数问题:当路由器或目的主机收到的数据报的首部中有的字段的值不正确时,就丢弃该数据报,并向源点发送参数问题报文(首部字段有问题)
改变路由(重定向):路由器把改变路由报文发送给主机,让主机知道下次应将数据报发送给另外的路由器(可通过更好的路由)
不应发送ICMP差错报文的情况
对ICMP差错报告报文不再发送ICMP差错报告报文
对第一个分片的数据报片的所有后续数据报片都不发送ICMP差错报告报文
对具有组播地址的数据报都不发送ICMP差错报告报文
对具有特殊地址(如127.0.0.0或0.0.0.0)的数据报不发送ICMP差错报告报文
ICMP询问报文
回送请求和回答报文
主机或路由向特定目的主机发出询问,收到此报文的主机必须给源主机或路由器发送ICMP回送回答报文
测试目的站是否可达以及了解其相关状态
ping + 域名
时间戳请求和回答报文
请某个主机或路由回答当前的时间和日期
用来进行时钟同步和测量时间
掩码地址请求和回答报文(被遗弃)
路由询问和通告报文(被遗弃)
ICMP的应用
PING:测试两个主机之间的连通性,使用ICMP回送请求和回答报文
Traceroute: 跟踪一个分组从源点到终点的路径,使用ICMP时间超过差错报告报文
IPv6
为什么要有IPv6
CIDR和NAT技术治标不治本,IPv6从根本上解决了地址耗尽问题
改进了首部格式
快速处理/转发数据报
支持QoS
数据报格式
- 基本首部40B固定长度,路由器处不能分片
- 版本:指明了协议版本,总是6
- 优先级:区分数据报的类别和优先级
- 流标签:流是互联网络上从特定源点到特定终点的一系列数据报
- 有效载荷长度:所有属于同一个流的数据报都具有相同的流标签
- 下一个首部:标识下一个扩展首部或上层协议首部
- 跳数限制:相当于IPv4的TTL
IPv6和IPv4的区别
- IPv6将地址从32位(4B)扩大到128位(16B),更大的地址空间
- IPv6将IPv4的校验和字段彻底移除,以减少每跳的处理时间
- IPv6将IPv4的可选字段移出首部,变成了扩展首部,成为灵活的首部格式,路由器通常不对扩展首部进行检查,大大提高了路由器的处理效率
- IPv6支持即插即用(自动配置),不需要DHCP协议
- IPv6首部长度必须是8B的整数倍,IPv4首部是4B的整数倍
- IPv6只能在主机处分片,IPv4可以在路由器和主机处分片
- ICMPv6:附加报文类型分组过大
- IPv6支持资源的预分配,支持实时视像等要求,保证一定的带宽和时延的应用
- IPv6取消了协议字段,改成下一个首部字段
- IPv6取消了总长度字段,改用有效载荷长度字段
- IPv6取消了服务类型字段
IPv6地址表示形式
一般形式:冒号十六进制记法(4BF5:AA12:0216:FEBC:BA5F:039A:BE9A:2170)
压缩形式:多个0用一个0代替,例如(4BF5:0000:0000:0000:BA 5F:039A:000A:2176 -> 4BF5:0:0:0:BA5F:39A:A:2176)
零压缩:一连串的0可以被一对冒号取代,例如(FF05:0:0:0:0:0:0:B3 -> FF05::B3),双冒号表示法在一个地址中仅可出现一次
IPv6基本地址类型
单播:一对一通信,可做源地址+目的地址
多播:一对多通信,可做目的地址
任播:一对多种的一个通信,可做目的地址
IPv6向IPv4过度的策略
双栈协议
在一台设备上同时启用IPv4和IPv6协议栈,既能进行IPv4通信也能进行IPv6通信。
如果是一个路由器,这台路由器的不同接口上,分别配置了IPv4和IPv6的地址,并很可能分别连接了IPv4和IPv6网络
如果是一台计算机,同时拥有IPv4和IPv6地址,并具备同时处理这两个协议地址的功能
隧道技术
通过使用互联网络的基础设施在网络之间传递数据的方式
使用隧道传递的数据(或负载)可以是不同协议的数据帧或包
隧道协议将其他协议的数据帧或包重新封装然后通过隧道发送
路由算法和路由协议概述
路由算法分类
静态路由算法
管理员手动配置路由信息
简便可靠,在负荷稳定、拓扑变化不大的网络中运行效果很好,广泛用于高度安全性的军事网络和较小的商业网络
路由更新慢,不适用大型网络
动态路由算法
路由器间彼此交换信息,按照路由算法优化出路由表项
路由更新快,适用大型网络,及时响应链路费用或网络拓扑变化
算法复杂,增加网络负担
全局性:链路状态路由算法OSPF(所有路由器掌握完整的网络拓扑和链路费用信息)
分散性:距离向量路由算法RIP(路由器只掌握物理相连的邻居及链路费用)
分层次的路由选择协议
因特网规模很大,许多单位不想让外界知道自己的路由协议,但还想联入因特网,因此产生了自治系统AS
自治系统AS
在单一的技术管理下的一组路由器,而这些路由器使用一种AS内部的路由选择协议和共同的度量,以确定分组在该AS内的路由
同时还使用一种AS之间的路由协议以确定在AS之间的路由
一个AS内的所有网络都属于一个行政单位来管辖,一个自治系统的所有路由器在本自治系统内都必须连通
路由选择协
内部网关协议IGP:一个AS内使用的(RIP,OSPF)
外部网关协议EGP:AS之间使用的(BGP-4)
RIP协议和距离向量算法
RIP协议
RIP是一种分布式的基于距离向量的路由选择协议,是因特网的协议标准,最大优点是简单
距离:通常为跳数,即从源端口到目的端口所经过的路由器个数,经过一个路由器跳数+1。特别的,从一个路由器到直接连接的网络距离为1
RIP允许一条路由器最多只能包含15个路由器,因此距离为16表示网络不可达
RIP协议要求网络中每一个路由器都维护从它自己到其他每一个目的网络的唯一最佳距离纪录(即一组距离)
RIP协议只适用于小型互联网
信息交换:仅和相邻路由器交换信息
交换内容:自己的路由表
多久交换一次:每30秒交换一次路由信息,然后路由器根据新信息更新路由表。若超过180s没收到邻居路由器的通告,则判定邻居没了,并更新自己的路由表
路由器刚开始工作时,只知道自己连接的网络的距离(距离为1),接着每一个路由器也只和数目非常有限的相邻路由器交换并更新路由信息。经过若干次更新后,所有路由器最终都会知道到达本自治系统任何一个网络的最短距离和下一跳路由器的地址,即收敛
距离向量算法
修改相邻路由器发来的RIP报文中所有表项,对地址为X的相邻路由器发来的RIP报文,修改次报文中的所有项目:把下一跳字段中的地址改为X,并把所有的距离字段+1
对修改后的RIP报文中的每一个项目进行以下步骤
- R1路由表中若没有Net3,则把该项目填入R1路由表
- R1路由表中若有Net3,则查看下一跳路由器地址:下一跳是X,则用收到的项目替换源路由表中的项目;若下一跳不是X,原来距离比从X走的距离远则更新,否则不做处理
- 若180s还没有收到相邻路由器X的更新路由表,则把X记为不可达的路由器,即把距离设置为16
- 返回
RIP报文格式
RIP是应用层协议,使用UDP传送数据
一个RIP报文最多可包含25个路由,如超过,必须在用一个RIP报文传送
RIP特点
当网络出现故障时,要经过比较长的时间(例如数分钟)才能将此信息传送到所有的路由器,慢收敛
OSPF协议与链路状态算法
OSPF协议
开放最短路径有线OSPF协议:开放标明OSPF协议不是受某一家厂商控制,而是公开发表的
最短路径优先是因为使用了Dijkstra提出的最短路径算法SPF
OSPF最主要的特征就是使用分布式的链路状态协议
OSPF协议的特点
和谁交换:使用洪泛法向自治系统内所有路由器发送信息,即路由器通过输出端口向所有相邻的路由器发送信息,而每一个相邻路由器又再次将此信息发往其所有的相邻路由器。(广播)最终整个区域内所有路由器都得到了这个信息的一个副本
交换什么:发送的信息就是与本路由器相邻的所有路由器的链路状态(本路由器和哪些路由器相邻,以及该链路的度量/代价–费用、距离、时延、带宽等)
多久交换:只有当链路状态发生变化时,路由器才向所有路由器洪泛发送此信息
最后,所有路由器都能建立一个链路状态数据库,即全网拓扑图
链路状态路由算法
每个路由器发现它的邻居节点[HELLO问候分组],并了解邻居节点的网络地址
设置到它的每个邻居的成本度量metric
构造【DD数据库描述分组】,相邻站给出自己的链路状态数据库中的所有链路状态项目的摘要信息
如果DD分组中的摘要自己都有,则邻站不做处理;如果有没有的或者是更新的,则发送【LSR链路状态请求分组】请求自己没有的和比自己更新的信息
收到邻站的LSR分组后,发送【LSU链路状态更新分组】进行更新
更新完毕后,邻站返回一个【LSAck链路状态确认分组】进行确认
只要一个路由器的链路状态发生变化
泛洪发送【LSU链路状态更新分组】进行更新
更新完毕后,其他站返回一个【LSAck链路状态确认分组】进行确认
使用Dijkstra根据自己的链路状态数据库构造到其他节点间的最短路径
OSPF区域
为了使OSPF能够用于规模很大的网络,OSPF将一个自治系统再划分为若干个更小的范围,叫做区域
每一个区域都有一个32位的区域标识符(用点分十进制表示)
区域也不能太大,在一个区域内的路由器最好不超过200个
OSPF其他特点
OSPF直接用IP数据报传送
每隔30min,要刷新一次数据库中的链路状态
由于一个路由器的链路状态只涉及到与相邻路由器的连通状态,因而整个互联网的规模并无直接关系,因此当互联网规模很大时,OSPF协议要比距离向量协议RIP好得多
OSPF不存在坏消息传的慢的问题,它的收敛速度很快
BGP协议
和谁交换:与其他AS的邻站BGP发言人交换信息
交换什么:交换的网络可达性的信息,即要达到某个网络所要经过的一系列AS
多久交换:发生变化时更新有变化的部分
BGP协议交换信息的过程
BGP所交换的网络可达性的信息就是要到达某个网络所要经过的一系列AS
当BGP发言人互相交换了网络可达性的信息后,各BGP发言人就根据所采用的策略从收到的路由信息中找出到达各AS的较好路由
是树型结构
BGP协议报文格式
一个BGP发言人与其他自治系统中的BGP发言人要交换路由信息,就要先建立TCP连接,即通过TCP传送
然后在此连接上交换BGP报文以建立BGP会话(session),利用BGP会话交换路由信息
BGP协议的特点
BGP支持CIDR,因此BGP的路由表也就应当包括目的网络前缀、下一跳路由器以及到达该目的网络所要经过的各个自治系统序列
在BGP刚刚运行时,BGP的邻站是交换整个BGP路由表
但以后只需要在发生变化时更新有变化的部分
这样做对节省网络带宽和减少路由器的处理开销都有好处
BGP-4的四种报文
OPEN(打开)报文:用来与相邻的另一个BGP发言人建立关系,并认证发送方
UPDATE(更新)报文:通告新路径或撤销原路径
KEEPALIVE(保活)报文:在无UPDATE时,周期性证实邻站的连通行;也作为OPEN的确认
NOTIFICATION(通知)报文:报告先前报文的差错,也被用于关闭连接
三种路由协议比较
RIP是一种分布式的基于距离向量的内部网关路由选择协议,通过广播UDP报文来交换路由信息
OSPF是一个内部网关协议,要交换的信息量较大,应使报文的长度尽量短,所以不使用传输层协议(如UDP和TCP),而是直接采用IP
BGP是一个外部网关协议,在不同的自治系统之间交换路由信息,由于网络环境复杂,需要保证可靠性传输,所以采用TCP
IP组播
IP数据报的三种传输方式
单播:单播用于发送数据报到单个目的地,且每发送一份单播报文都是用一个单播IP地址作为目的地址,是一种点对点传输方式
广播:发送数据包到同一广播域或子网内的所有设备的一种数据传输方式,是一种点对多点传输方式
组播(多播):当网络中的某些用户需要特定数据时,组播数据发送者仅发送一次数据,借助组播路由协议为组播数据包建立组播分发树,被传递的数据到达距离用户端尽可能近的节点后才开始复制和分发,是一种点对多点传输方式
组播提高了数据传输效率;减少了主干网出现拥塞的可能性;组播中的主机可以是同一个物理网络,也可以来自不同的物理网络;如果有组播路由器的支持,需要运行组播协议的路由器
IP组播地址
IP组播地址让源设备能够将分组发送给一组设备
属于多播组的设备将被分配一个组播组IP地址(一群共同需求主机的相同标识)
组播地址范围为224.0.0.0~239.255.255.255(D类地址),一个D类地址表示一个组播组
只能用作分组的目标地址,源地址总是为单播地址
组播数据包也是尽最大努力交付,不提供可靠交付,应用于UDP
对组播数据包不产生ICMP差错报文
并非所有D类地址都可以作为组播地址
硬件组播
同单播地址一样,组播IP地址也需要相应的组播MAC地址在本地网络中实际传送帧
组播MAC地址以十六进制01-00-5E打头,余下6个十六进制位是根据IP组播地址的最后23位转换得到的
TCP/IP协议使用的以太网多播地址范围是从01-00-5E-00-00-00到01-00-5E-7F-FF-FF
收到多播数据报的主机,还要在IP层利用软件进行过滤,把不是本主机的接收的数据报丢弃
IGMP协议
GMP协议让路由器知道本局域网上是否有主机(的进程)参加或退出了某个组播组
ICMP和IGMP都使用IP数据报传递报文
IGMP工作的两个阶段
某个主机要加入组播组时,该主机向组播组的组播地址发送一个IGMP报文,声明自己要成为该组的成员。
本地组播路由器接收到IGMP报文后,要利用组播路由器选择协议把这个组成员关系发送给因特网上的其他组播路由器。只要有一个主机对某个组响应,那么组播路由器就认为这个组是活跃的;如果经过几次探询后没有一个主机响应,组播路由器就认为本网络上没有此组播组的主机,因此就不再把这组的成员关系发给其他的组播路由器
组播路由器知道的成员关系只是所连接的局域网中有无组播组的成员
组播路由器选择协议
组播路由器选择协议目的是找出以源主机为根节点的组播转发树
构造树可以避免在路由器之间兜圈子;对不同的多播组对应于不同的多播转发树;同一个多播组,对不同的源点也会有不同的多播转发树
组播路由选择协议的三种算法
- 基于链路状态的路由选择
- 基于距离-向量的路由选择
- 协议无关的组播(稀疏/密集)
移动IP
定义: 移动IP技术是移动结点(计算机/服务器等)以固定的网络IP地址,实现跨越不同网段的漫游功能,并保证了基于网络IP的网络权限在漫游过程中不发生任何改变。
移动节点: 具有永久IP地址的移动设备。
归属代理(本地代理): 一个移动结点的永久“居所”称为归属网络,在归属网络中代表移动节点执行移动管理功能的实体叫做归属代理
永久地址(归属地址/主地址): 移动站点在归属网络中的原始地址
外部代理(外地代理): 在外部网络中帮助移动节点完成移动管理功能的实体称为外部代理。
转交地址(辅地址): 可以是外部代理的地址或动态配置的一个地址。
移动IP通信过程
A刚进入外部网络
获得外部代理的转交地址(外部代理广播报文)
移动节点通过外部代理发送注册报文给归属代理(包含永久地址&转交地址)
归属代理接收请求,并将移动节点的永久地址和转交地址绑定(以后到达该归属代理的数据报且要发往移动节点的数据报将被封装并以隧道方式发给转交地址),并返回一注册响应报文。
外部代理接收注册响应,并转发给移动节点。
A移动到了下一个网络
在新外部代理登记注册一个转交地址。
新外部代理给本地代理发送新的转交地址(覆盖旧的)。
通信
A回到了归属网络
A向本地代理注销转交地址。
按原始方式通信。
网络层设备
路由器
定义:路由器是一种具有多个输入端口和多个输出端口的专用计算机,其任务是转发分组。
路由选择:根据所选定的路由选择协议构造出路由表,同时经常或定期地和相邻路由器交换路由信息而不断地更新和维护路由表。
交换结构:根据转发表(路由表得来)对分组进行转发。
分组转发:若收到RIP/OSPF分组等,则把分组送往路由选择处理机; 若收到数据分组,则查找转发表并输出。
输入端口对线路上收到的分组的处理
输入端口中的查找和转发功能在路由器的交换功能中是最重要的。
输出端口将交换结构传送来的分组发送到线路
若路由器处理分组的速率赶不上分组进入队列的速率,则队列的存储空间最终必定减少到零,这就使后面再进入 队列的分组由于没有存储空间而只能被丢弃。
路由器中的输入或输出队列产生溢出是造成分组丢失的重要原因。
三层设备的区别
路由器(网络层):可以互联两个不同网络层协议的网段。
网桥(数据链路层):可以互联两个物理层和链路层不同的网段。
集线器(物理层):不能互联两个物理层不同的网段。
路由表于路由转发
路由表:根据路由选择算法得出的,主要用途是路由选择,总用软件来实现。
转发表:由路由表得来,可以用软件实现,也可以用特殊的硬件来实现。转发表必须包含完成转发功能所必需的信息,在转发表的每一行必须包含从要到达的目的网络到输出端口和某些MAC地址信息的映射。