Ceph集群中节点A向节点B的OSD发tcp包,发现B节点的OSD处理该包的时间与该包中携带的A节点发送该包的时间差大于10ms,经过查看业务代码,发现OSD使用epoll_wait有问题,在每次调用epoll_wait获取tcp包处理完毕后,会串行处理其他的事件,某些情况下,由于其他事件处理耗时较多,导致下一次调用epoll_wait的时候增加了一定时延,这个时延就导致了OSD处理包的时延。