一篇文章 让你真正搞懂epoll机制
转载自 物联网心球
epoll简介
-
epoll是Linux内核为处理大批量文件描述符而作了改进的poll,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率。
-
epoll可以理解为event poll,它是一种事件驱动的I/O模型,可以用来替代传统的select和poll模型。epoll的优势在于它可以同时处理大量的文件描述符,而且不会随着文件描述符数量的增加而降低效率。
-
epoll的实现机制是通过内核与用户空间共享一个事件表,这个事件表中存放着所有需要监控的文件描述符以及它们的状态,当文件描述符的状态发生变化时,内核会将这个事件通知给用户空间,用户空间再根据事件类型进行相应的处理。
-
epoll的接口和工作模式相对于select和poll更加简单易用,因此在高并发场景下被广泛使用。
epoll实现原理

socket等待队列
-
socket等待队列用于在socket接收到数据后添加就绪epoll事件节点和唤醒eventpoll等待队列项。
-
socket收到数 据后,唤醒socket等待队列项,并执行等待队列项注册的回调函数ep_poll_callback,ep_poll_callback函数将就绪epoll事件节点添加至就绪队列,并唤醒eventpoll等待队列项。
eventpoll等待队列
-
eventpoll等待队列用于阻塞当前进程,用于epoll_wait未检测到就绪epoll事件节点的情况。
-
epoll_wait检测就绪队列是否有epoll事件节点,没有epoll事件节点,则使用等待队列将当前进程挂起,后续ep_poll_callback函数会唤醒当前进程。
就绪队列
- 就绪队列用于存储就绪epoll事件节点,用户通过epoll_wait函数获取就绪epoll事件节点。
红黑树
- 红黑树用于存储通过epoll_ctl函数注册的epoll事件节点。
创建epoll文件
epoll_create
int epoll_create(int size);
-
功能:epoll_create函数用于创建epoll文件。
-
参数:
- size:目前内核还没有实际使用,只要大于0就行。
-
返回值:
-
成功:返回epoll文件描述符。
-
失败:返回-1,并设置errno。
-

增加,删除,修改epoll事件
epoll_ctl
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
-
功能:epoll_ctl函数用于增加,删除,修改epoll事件,epoll事件会存储于内核epoll结构体红黑树中。
-
参数:
-
epfd:epoll文件描述符。
-
op:操作码
-
EPOLL_CTL_ADD:插入事件
-
EPOLL_CTL_DEL:删除事件
-
EPOLL_CTL_MOD:修改事件
-
-
fd:epoll事件绑定的套接字文件描述符。
-
events:epoll事件结构体。
-
-
返回值:
-
成功:返回0。
-
失败:返回-1,并设置errno。

-
struct epoll_event结构体
struct epoll_event{
uint32_t events; //epoll事件,参考事件列表
epoll_data_t data;
} ;
typedef union epoll_data {
void *ptr;
int fd; //套接字文件描述符
uint32_t u32;
uint64_t u64;
} epoll_data_t;
epoll事件列表
enum EPOLL_EVENTS {
EPOLLIN = 0x001, //socket可读。
EPOLLPRI = 0x002, //socket有紧急数据。
EPOLLOUT = 0x004, //socket可写。
EPOLLRDNORM = 0x040,
EPOLLRDBAND = 0x080,
EPOLLWRNORM = 0x100,
EPOLLWRBAND = 0x200,
EPOLLMSG = 0x400,
EPOLLERR = 0x008, //socket文件出错。
EPOLLHUP = 0x010, //socket文件被挂起。
EPOLLRDHUP = 0x2000, //socket文件被关闭或者关闭读端。
EPOLLEXCLUSIVE = 1u << 28,
EPOLLWAKEUP = 1u << 29,
EPOLLONESHOT = 1u << 30, //单次模式,执行完epoll_wait后需重新调用epoll_ctl注册事件。
EPOLLET = 1u << 31 //边缘触发,默认为水平触发。
};
epoll事件如何处理?
-
epoll事件处理原则:epoll_wait获取epoll事件 = 注册epoll事件 & 就绪epoll事件

-
epoll_ctl函数增加epoll事件时,系统默认注册EPOLLERR和EPOLLHUP事件。

epoll事件处理示例
- 注册epoll事件
struct epoll_event ev;
ev.data.fd = sock_fd;
ev.events = EPOLLIN; //注册EPOLLIN事件
epoll_ctl(efd, EPOLL_CTL_ADD, sock_fd, &ev);
- 就绪epoll事件
res = EPOLLIN | EPOLLRDNORM;
- epoll_wait获取事件
events = (EPOLLIN|EPOLLERR|EPOLLHUP)&(EPOLLIN|EPOLLRDNORM) = EPOLLIN;
- ==注意:只有注册的事件才能通过epoll_wait获取。==
epoll事件就绪
epoll_wait
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
-
功能:epoll_wait用于监听epoll事件。
-
参数:
-
epfd:epoll文件描述符。
-
events:epoll事件数组。
-
maxevents:epoll事件数组长度。
-
timeout:超时时间,
-
小于0:一直等待。
-
等于0:立即返回。
-
大于0:等待超时时间返回,单位毫秒。
-
-
-
返回值:
-
小于0:出错。
-
等于0:超时。
-
大于0:返回就绪事件个数。

-
epoll编程流程
