Netty学习之IO基础

引言

Netty是一个网络开发的库,它在Java网络开发中的地位相当于Spring之于Java。

Netty是基于Java NIO开发的一套网络库,在其基础上提升了API的易用性,修复了Java NIO存在的一些bug。

IO基础

Linux网络IO模型简介

Linux内核将所有外部设施都看作一个文件进行操作,对一个文件的读写操作会执行内核提供的系统调用(可以理解为操作系统提供的api),返回一个文件描述符(fd,文件描述符)。同理,对于socket的读写也有相应的描述符,成为socketfd(socket描述符)。描述符就是一个数字,指向内核的一个结构体(文件路径,数据区等一些属性)

UNIX网络编程提供了5种IO模型,分别如下:

阻塞IO模型

最常用的IO模型,默认情况下,所有文件操作都是阻塞的。在进程空间中调用recvfrom,其系统调用直到数据包到达且被复制到应用进程的缓冲区中或者发生错误才返回。在此期间,会一直等待,进程在调用recvfrom开始到它返回数据整段时间内都是阻塞的,因此被称为阻塞IO模型。具体调用流程如下图:

BIO

非阻塞IO模型

recvfrom从应用层到内核的时候,如果缓存区没有数据,直接返回一个EWOULDBLOCK错误,一般对非阻塞IO模型轮询这个状态,检查数据是否到来。具体调用流程如下图:

BIO

IO复用模型

Linux提供select/poll,进程通过将一个或者多个fd传递给select或者poll系统调用,阻塞在select上,这样select/poll可以帮我侦测多个fd是否处于就绪状态。select/poll是顺序扫描fd是否就绪,而且支持的fd数量有限,因此它的使用受到一些限制。同时,Linux还提供一个epoll系统调用,epoll使用基于事件驱动的方式代替顺序扫描,因此性能更高。当有fd就绪,立即回调函数rollback。具体调用流程如下:

BIO

信号驱动IO模型

首先开启套接字接口信号驱动IO功能,并通过系统调用sigaction执行一个信号处理函数(此系统调用立刻返回,进程继续工作,它是非阻塞的)。当数据准备就绪时,就为该进程生成一个SIGIO信号,通过信号回调通知应用程序调用用recvfrom来读取数据,并通知主循环处理数据。具体调用流程如下:

BIO

异步IO模型

告知内核启用某个操作,并让内核在整个操作系统完成后(包括将数据从内核复制到用户自己的缓存区)通知我们。这种模型和信号量驱动模型有点类似,区别是:信号驱动IO由内核通知我们什么时候可以开始一个IO操作;异步IO由内核通知我们IO操作合适已经完成。具体调用流程如下:

BIO

了解这些网络IO模型之后,会对于理解Java的NIO类库有帮助。

IO多路复用技术

在IO编程中,如果需要同时处理多个客户端的接入请求时,可以利用多线程或者IO多路复用技术处理。IO多路复用是将多个IO阻塞复用到一个select阻塞上去,使得系统在单线程的情况下可以同时处理多个客户端的请求。于传统多线程多进程模型相比,IO多路复用的优势就是系统开销小,系统不需要创建新的额外的进程或者线程,也不需要维护这些进程和线程的运行,降低了系统维护的工作量,节省了系统的资源,IO多路复用的场景:

  1. 服务器需要同时处理多个处于监听状态或者多个连接状态的套接字
  2. 服务器需要处理多种网络协议的套接字