进程控制之解释器文件

it2022-05-05 136

所有现今的UNIX系统都支持解释器文件（interpreter file）（也可称为解释器脚本）。这种文件是文本文件，其起始行格式是：

#! pathname [optional-argument]

感叹号和pathname之间的空格是可选的。最常见的解释器文件以下列行开始：

#!/bin/sh

pathname通常是绝对路径名，对它不进行什么特殊的处理（即不使用PATH进行路径搜索）。对这种文件的识别是由内核作为exec系统调用处理的一部分来完成的。内核调用exec函数的进程实际执行的并不是该解释器文件，而是该解释器文件第一行中pathname所指定的文件。一定要将解释器文件（文本文件，它以#!开头）和解释器（由该解释器文件第一行中的pathname指定）区分开来。（我们可以认为：解释器文件就是在首行指定了其所使用的解释器的文本文件。）

要知道很多系统对解释器文件的第一行有长度限制。这些限制包括#!、pathname、可选参数、终止换行符以及空格数。在Linux中支持该限制为127字节。

实例

让我们观察一个实例，从中可了解当被执行的文件是解释器文件时，内核如何处理exec函数的参数及该解释器文件第一行的可选参数。程序清单8-10调用exec执行一个解释器文件。

程序清单8-10 执行一个解释器文件的程序

[root@localhost apue]# cat prog8-10.c #include "apue.h" #include <sys/wait.h> int main(void) { pid_t pid; if((pid = fork()) < 0) { err_sys("fork error"); } else if(pid == 0) /* child */ { if(execl("/home/zhu/apue/testinterp", "testinterp", "myarg1", "MY ARG2", (char *)0) < 0) err_sys("execl error"); } if(waitpid(pid, NULL, 0) < 0) /* parent */ err_sys("waitpid error"); exit(0); }

程序清单8-10中被执行的解释器文件内容如下（只有一行）：

[root@localhost apue]# cat testinterp #!/home/zhu/apue/echoarg foo

程序echoarg（解释器）回送每一个命令行参数（它就是程序清单7-3，参见：http://www.cnblogs.com/nufangrensheng/p/3507949.html）。

程序清单8-10运行结果：

[root@localhost apue]# ./prog8-10 argv[0]: /home/zhu/apue/echoarg argv[1]: foo argv[2]: /home/zhu/apue/testinterp argv[3]: myarg1 argv[4]: MY ARG2

注意，当内核exec该解释器（/home/zhu/apue/echoarg）时，argv[0]是该解释器的pathname，argv[1]是解释器文件中的可选参数，其余参数是pathname（/home/zhu/apue/testinterp），以及程序清单8-10中调用execl的第二个和第三个参数（myarg1和MY ARG2）。调用execl时的argv[1]和argv[2]已右移了两个位置（？）。注意，内核取execl调用中的pathname而非第一个参数（testinterp），因为一般而言，pathname包含了比第一个参数更多的信息（通常第一个参数只是pathname的一部分）。

总的来说，当内核exec解释器时，其命令行参数依次是该解释器的pathname、解释器的可选参数、解释器文件的pathname、exec函数调用参数列表中argv[0]以后的参数（不包括argv[0]，通常argv[0]只是解释器文件pathname中的一部分）。（http://www.cnblogs.com/nufangrensheng/p/3510821.html中有提到我们可将argv[0]设置为任何字符串。）

另外还有一篇关于解释器和解释器文件比较简明扼要的一篇文章，可参考：http://www.cnblogs.com/beacer/archive/2012/09/16/2687659.html

实例

在解释器pathname后可跟随可选参数。如果一个解释器程序支持-f选项，那么在pathname后经常使用的可选参数就是-f。

例如，可以以下列方式执行awk（1）程序：

awk -f myfile

它告诉awk从文件myfile中读取awk程序。

如果在解释器文件中使用-f选项，则可以写成：

#!/bin/awk -f ......

如果我们在myfile的第一行写：#!/bin/awk -f，那么我们想要执行awk程序myfile时，不必再输入命令awk –f myfile，而是直接输入命令myfile即可。

例如，程序清单8-11为/usr/local/bin/awkexample这样一个解释器文件。

程序清单8-11 作为解释器文件的awk程序

#!/bin/awk -f BEGIN { for(i=0; i<ARGC; i++) printf "ARGV[%d] = %s\n", i, ARGV[I] exit }

如果路径前缀之一是/usr/local/bin，则可以用下列方式执行程序清单8-11：

[root@localhost apue]# awkexample file1 FILENAME2 f3 ARGV[0] = awk ARGV[1] = file1 ARGV[2] = FILENAME2 ARGV[3] = f3

其实，shell会这样调用exec：

exec("/usr/local/bin/awkexample", "awkexample", "file1", "FILENAME2", "f3", NULL);

但是，实际上exec执行的是解释器/bin/awk而不是解释器文件awkexample，并且其命令行参数是：

/bin/awk -f /usr/local/bin/awkexample file1 FILENAME2 f3

是否一定需要解释器文件呢？那也不完全如此。但是它们确实使用户得到效率方面的好处，其代价是内核的额外开销（因为识别解释器文件的是内核）。

由于下述理由，解释器文件是有用的：

（1）有些程序是用某种语言编写的脚本，解释器文件可将这一事实隐藏起来。例如，为了执行程序8-11，只需使用下列命令行：

awkexample opitonal-arguments

而并不需要知道该程序实际上是一个awk脚本，否则就需要以下列方式执行该程序：

awk -f awkexample optional-arguments

（2）解释器脚本在效率方面也提供了好处。通常，用一个shell脚本代替解释器脚本需要更多的开销。

（3）解释器脚本使我们可以使用除/bin/sh以外的其他shell来编写shell脚本。（当execlp找到一个非机器可执行的可执行文件时(shell脚本是一个可执行文件，但却不是机器可执行的)，它总是调用/bin/sh来解释执行该文件。）此时，我们只需要在解释器脚本首行指明所用的shell即可。

本篇博文内容摘自《UNIX环境高级编程》（第二版），仅作个人学习记录所用。关于本书可参考：http://www.apuebook.com/。

转载于:https://www.cnblogs.com/nufangrensheng/p/3511768.html

专利

最新回复(0)