程序在使用一个函数之前,应该首先声明该函数。为了便于使用,通常的做法是把同一类函数或数据结构以及常数的声明放在一个头文件(header file)中。头文件中也可以包括任何相关的类型定义和宏(macros)。在程序源代码文件中则使用预处理指令“#include”来引用相关的头文件。
程序中如下形式的一条控制行语句将会使得该行被文件filename的内容替换掉:
# include
当然,文件名filename中不能包含 > 和换行字符以及 "、'、、或 /* 字符。编译系统会在定义的一系列地方搜索这个文件。类似地,下面形式的控制行会让编译器首先在源程序所在目录中搜索filename文件:
# include "filename"
如果没有找到,编译器再执行同上面一样的搜索过程。在这种形式中,文件名filename中不能包含换行字符和 "、'、、或 /* 字符,但允许使用 > 字符。
在一般应用程序源代码中,头文件与开发环境中的库文件有着不可分割的紧密联系,库中的每个函数都需要在头文件中加以声明。应用程序开发环境中的头文件(通常放置在系统/usr/include/目录中)可以看作是其所提供函数库(例如libc.a)中函数的一个组成部分,是库函数的使用说明或接口声明。在编译器把源代码程序转换成目标模块后,链接程序(linker)会把程序所有的目标模块组合在一起,包括用到的任何库文件中的模块。从而构成一个可执行的程序。
对于标准C函数库来讲,其最基本的头文件有15个。每个头文件都表示出一类特定函数的功能说明或结构定义,例如I/O操作函数、字符处理函数等。有关标准函数库的详细说明及其实现可参照Plauger编著的《The Standard C Library》一书。
而对于本书所描述的内核源代码,其中涉及的头文件则可以看作是对内核及其函数库所提供服务的一个概要说明,是内核及其相关程序专用的头文件。在这些头文件中主要描述了内核所用到的所有数据结构、初始化数据、常数和宏定义,也包括少量的程序代码。除了几个专用的头文件以外(例如块设备头文件blk.h),Linux 0.12内核中所用到的头文件都放在内核代码树的include/目录中。因此编译Linux 0.12内核无需使用开发环境提供的位于/usr/include/目录下的任何头文件。当然,tools/build.c程序除外。因为这个程序虽然被包含在内核源代码树中,但它只是一个用于组合创建内核映像文件的工具程序或应用程序,不会被链接到内核代码中。
从0.95版开始,内核代码树中的头文件需要复制到/usr/include/linux目录下才能顺利地编译内核。即从该版内核开始头文件已经与开发环境使用的头文件合二为一。
14.1 include/目录下的文件
内核所用到的头文件都保存在include/目录下。该目录下的文件如表11-1所示。这里需要说明一点:为了方便使用和兼容性,Linus在编制内核程序头文件时所使用的命名方式与标准C库头文件的命名方式相似,许多头文件的名称甚至其中的一些内容都与标准C库的头文件基本相同,但这些内核头文件仍然是内核源代码或与内核有紧密联系的程序专用的。在一个Linux系统中,它们与标准库的头文件并存。通常的做法是将这些头文件放置在标准库头文件目录中的子目录下,以让需要用到内核数据结构或常数的程序使用。
另外,也由于版权问题,Linus试图重新编制一些头文件以取代具有版权限制的标准C库的头文件。因此这些内核源代码中的头文件与开发环境中的头文件有一些重叠的地方。在Linux系统中,列表14-1中的asm/、linux/和sys/三个子目录下的内核头文件通常需要复制到标准C库头文件所在的目录(/usr/include)中,而其他一些文件若与标准库的头文件没有冲突则可以直接放到标准库头文件目录下,或者改放到这里的三个子目录中。
asm/目录下主要用于存放与计算机体系结构密切相关的函数声明或数据结构的头文件。例如Intel CPU 端口IO汇编宏文件io.h、中断描述符设置汇编宏头文件system.h等。linux/目录下是Linux内核程序使用的一些头文件。其中包括调度程序使用的头文件sched.h、内存管理头文件mm.h和终端管理数据结构文件tty.h等。而sys/目录下存放着几个与内核资源相关头文件。不过从0.98版开始,内核目录树下sys/目录中的头文件被全部移到了linux/目录下。
Linux 0.12版内核中共有32个头文件(*.h),其中asm/子目录中含有4个,linux/子目录中含有10个,sys/子目录中含有5个。从下一节开始我们首先描述include/目录下的13个头文件,然后依次说明每个子目录中的文件。说明顺序按照文件名称排序进行。