文件描述符
进程每打开一个文件的时候,会获得该文件的文件描述符,而后续的读写操作都把文件描述符作为参数。在用户空间或者内核空间,都是通过文件描述符来唯一地索引一个打开的文件。文件描述符使用int类型表示,文件描述符的范围从0开始,到上限值-1,默认情况下,上限值为1024,也就是说,进程默认情况下最多可以打开1024个文件。负数是不合法的文件描述符,当函数调用出错时,返回的文件描述符为-1。
每个进程都至少包含三个文件描述符:
遵循Linux一切皆文件的概念,文件描述符除了访问普通文件外,几乎能够访问任何能够读写的东西。包括设备文件、管道、先进先出缓冲区、套接字等。
open()系统调用
对文件进行读写之前,必须先打开文件。Linux提供了系统调用open()。open()有两个函数原型:
两个函数均可用来打开文件,第二个函数比第一个多了参数mode,mode指定文件的权限---当创建新文件的时候才需要。如果文件打开成功,则返回文件描述符,指向pathname所指定的文件。flags参数用于指定打开的方式,它支持三种访问模式:
flags参数还可以与下面的值进行按位或运算,修改打开文件的行为:
举个例子,下面的句子表示:以写的方式打开文件,如果文件不存在,则创建新的文件,并且文件的内容为空:
int fd ;
fd = open("file.txt",O_WRONLY|O_CREAT|O_TRUNC,0644);
这里的0644指定了新创建的文件访问权限,参数mode的取值如下:
实际上最终写入磁盘的文件访问权限是由mode参数和用户的文件创建掩码(umask)执行按位与操作得到的。举个例子:
按理来说,创建出来的文件的访问权限应该是-rwxrwxrwx,而查看后发现其实不是:
ls -l TEST.txt
-rwxrwxr-x 1 huanzhewu huanzhewu 0 8月 30 21:29 TEST.txt【权限为0775】
查看当前的掩码:
$ umask
0002
可以发现 0775 = 0777 ^ (~0002) ,所以0775才是最后的文件访问权限。umask是进程级属性,通过调用umask()函数来修改,支持用户修改新创建的文件和目录的权限。
总结起来可以得到这样一条公式:
newmode = mode ^ (~ umask)
总结一下:至此,我们了解了文件打开所提供的两个系统调用函数open(),了解了打开文件的方式、新建文件的访问权限设置。如果文件打开成功,那么将返回一个文件描述符,这是一个非零整数(因为0,1,2是进行已经拥有的文件描述符),否则函数将返回-1
creat()系统调用
顾名思义,creat函数用来创建一个文件,不过我们可能产生疑问:前面的open函数使用一些选项后,不是也可以创建新文件吗?没错,creat函数完全等价与下面的open语句:
由于选项O_WRONLY|O_CREAT|O_TRUNC组合经常使用,因而系统调用专门使用creat函数来提供这个功能。creat函数的原型如下:
其中参数的描述与open的参数一致,这里不再赘述。
read()系统调用
文件打开后,就能够读文件了。read()是最基础、最常见的读取文件的机制。read的函数原型为:
fd 为文件描述符。每次调用read函数时,会从fd指向的文件的当前偏移(或称文件位置)开始读取count字节到buf所指的的内存中。随着文件的读取,fd的文件位置指针会向前移动。关于read的读取,会出现很多需要思考的问题:
问题一:如果文件长度为0
问题二:如果文件长度不够count长度
问题三:如果读取时,read被信号中断了
我们一一来看:
问题1属于“没有数据可读”,此时read调用会阻塞,直到有数据可读;
问题2属于到达数据结尾(EOF),此时read调用返回0;
问题三,read调用返回大于0小于count的值;如果在读取任何数据之前被信号中断,则返回-1,同时把errno设置为EINTR。
再来看看问题1,当文件没有数据可以读时(一开始就没有),read调用会被阻塞,直到文件有数据可以读,这是一种阻塞I/O。如果文件以O_NONBLOCK模式打开,则文件为非阻塞模式,当文件没有数据可以读时,read系统调用返回-1,并把errno设置为EAGAIN。
除了errno被设置为EINTR与EAGAIN,其他情况下都是出现严重的文件读取错误,重新执行读操作不会成功。
write() 系统调用
write的函数原型为:
write的返回值比较简单:
写入失败返回-1 ,同时设置errno的值
写入成功返回成功写入的字节数。
返回0时没有特殊含义,仅表示写入了0个字节的内容。
对于普通文件,write基本能保证每次执行调用能够写入全部的内容。对于其他文件如socket,需要进行循环写,保证所有的字节都写入了文件中:
同样的,当以非阻塞的模式打开文件时(O_NONBLOCK),系统调用write()会返回-1,并把errno设置为EAGAIN。
系统调用write()时,数据从用户空间的缓冲区中拷贝到了内核空间的缓冲区,但并没有立即把数据写入磁盘中,这称为延迟写。延迟写的问题在于,如果在数据真正写入磁盘之前系统崩溃了,则数据可能丢失。内核设置了一个时间,在该时间内将内核空间缓冲区上的数据写入磁盘,该时间称为"最大存放时效"。Linux系统也支持强制文件立即写入磁盘上,这在后面介绍。
close()系统调用
程序完成文件的读写后,调用close函数关闭文件描述符与文件之间的连接,使得文件描述符可以被重用。close的函数原型为:
#incldue
int close(int fd);
文件关闭成功返回0,出错返回-1,并设置相应的errno。文件成功关闭并不以为着该文件的数据已经被写入磁盘。
总结:本文简单介绍了文件的打开、创建、读写、关闭操作,介绍了一些常用的open参数选项,creat与open的等价性,循环读、循环写的必要性,也关注了各个系统调用的返回值含义,了解如何设置非阻塞读写,并简单提到了延迟写的问题,在后续的文件中将介绍同步I/O的内容。
责任编辑:haq
全部0条评论
快来发表一下你的评论吧 !