Linux下提高性能的系统调用sendfile,splice和tee
熟悉Linux内核2.4版本的也许知道:在2.4版的内核中内嵌了一个叫做khttpd的静态网页服务器。当时,可能是效率的因素致使她被添加了进来,至于为什么最新的2.6版内核去掉了这个服务器,我考虑可能是因为Linux内核“只提供机制,
熟悉Linux内核2.4版本的也许知道:在2.4版的内核中内嵌了一个叫做khttpd的静态网页服务器。当时,可能是效率的因素致使她被添加了进来,至于为什么最新的2.6版内核去掉了这个服务器,我考虑可能是因为Linux内核“只提供机制,而不提供策略”,当然安全因素也不能排除在外。
实际上,把网页服务器做进内核也是完全没有必要的,因为Linux内核提供了sendfile这样一个系统调用:
#include <sys/sendfile.h>
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);
她能把一个文件从特定部分开始的特定块通过一个socket发送出去,从而避免了多次调用read和write的内核上下文和用户上下文切换的开销,并且由于其内部实现利用了mmap技术,也减少了内存的复制开销。有了她,请问khttpd还有那么必要么?
splice和tee是2.6.17版的Linux内核首次引入的:
#define _GNU_SOURCE
#include <fcntl.h>
long splice(int fd_in, off_t *off_in, int fd_out,
off_t *off_out, size_t len, unsigned int flags);
#define _GNU_SOURCE
#include <fcntl.h>
long tee(int fd_in, int fd_out, size_t len, unsigned int flags);
这两个主要用来减少管道和其他描述符之间传递数据时的read和write系统调用的数目,详细用法请查看man页,其中tee的man页中还给出了采用splice和tee重新实现的一个tee命令作为示例,如有兴趣,可查看一下。
与他们一同引入的还有vmsplice:
#define _GNU_SOURCE
#include <fcntl.h>
#include <sys/uio.h>
long vmsplice(int fd, const struct iovec *iov,
unsigned long nr_segs, unsigned int flags);
这个系统调用将用户空间的内存映射到内核空间,从而避免了实际的内存写操作,提高了系统效率。
不过,我并没有觉得splice,tee和vmsplice在实际的代码中很“有用”,倒是觉得如果能去除对管道的限制更好些。因为隧道型的代理服务程序,在连接建立后,剩下的主要任务就是在两个socket之间互相relay数据,如果能把他们splice起来,还是能在一定程度上提高效率的。