Skip to content
Go back

Unix基础知识笔记

Edit page

头文件与编译链接

为什么要有头文件?

  • 头文件中包含了常量定义、类型定义和函数声明。 在编译之前,预处理器 会将头文件的内容直接复制到源代码中。

编译与链接阶段

  • 隐式声明陷阱(C语言的历史遗留规则): 若在代码中调用了一个未声明的函数(例如未包含 <math.h> 就调用 log 函数),编译器会隐式假设该函数返回 int 类型
    • 此时编译器不会直接抛出“函数未声明”的错误,而是基于 int 的假设生成代码。
    • 在链接阶段,只要你链接了对应的库(如 -lm),就不会报错。
    • 后果: 虽然不报错,但例如 log 函数实际返回的是 double。隐式声明为 int 会导致返回值类型不匹配,在程序运行时会出现错误的计算结果(比如 double 截断转 int 导致的数据损坏)。
  • 编译阶段: 编译器只负责将源码转为机器码。它依据函数声明(不管是显式的还是隐式的)来处理函数调用的参数传递和返回值接收逻辑。
  • 链接阶段: 链接器只负责在库中(如数学库 libm.so 中)找到函数的实际二进制实现,并将调用处的地址与函数实现的地址关联起来。链接器不检查类型,只要函数名匹配就能完成链接,完全忽略编译阶段可能存在的类型错误假设。
  • 建议: 类型检查

库 (Libraries)

在编译时,需要指定程序与相应的库进行链接。

静态库 vs. 共享库

  • 静态库: 文件名通常为 libx.a.a 是 archive 的缩写,代表静态归档库)。
    • 原理: 链接时,静态库会把程序用到的函数代码直接复制粘贴到最终的可执行文件中。
    • 特点: 运行时不需要额外加载库文件,但可执行文件体积较大。
  • 共享库: 文件名通常为 libx.so.so 是 shared object 的缩写,代表动态共享库)。
    • 原理: 链接时,编译器会扫描 libx.so 中的引用,在生成的可执行文件中写入**“需要加载 libx.so 库”的标记以及函数引用地址的占位符**,而不会把库里的实际代码复制进去。
    • 运行时绑定: 当程序运行时,操作系统的动态装载器会根据可执行文件中的标记,找到并加载对应的 libx.so 到内存中,然后将可执行文件中的占位符地址替换为共享库中实际函数的内存地址(这个过程叫绑定)。之后程序调用该函数时,就会跳转到共享库中对应的代码执行。
    • 特点: 多个程序可以共享内存中的同一份库代码,可执行文件体积更小。

链接参数 -lx

当链接器遇到如 -lm(意为链接数学库 math)的参数时,-lx 是通用的库引用格式(x 是库名前缀)。链接器会按照预设的优先级去查找这两种格式的库文件,无需开发者手动写死路径,从而适配不同系统的安装位置。

  • 查找优先级: -L 指定的目录 \rightarrow LD_LIBRARY_PATH 环境变量 \rightarrow 系统标准库目录。
  • 静态库和共享库哪个是默认选项,取决于具体操作系统的设置。如果想强制使用静态库,通常使用 -Bstatic 参数。

宏与条件编译

在单一 Unix 规范 (Single UNIX Specification) 发布之前,存在多个互不兼容的 Unix 标准。为了让同一份源代码能在不同的系统上编译运行,预处理器发挥了巨大作用。

  • 预处理语句: 预处理器使用 #if, #ifdef, #ifndef 等预处理语句,根据当前系统的环境进行代码替换,或决定哪些代码参与编译、哪些被忽略,从而为同一个源文件产生不同的机器代码。
  • 特性宏: Linux 的头文件中包含了很多不同标准的实现,有些功能是标准的,有些是扩展的(如 GNU 扩展)。为了防止命名冲突,很多非标准的特性功能默认是隐藏的
    • _GNU_SOURCE 就是一个常量,如果在代码的最顶端定义了常量 #define _GNU_SOURCE,就相当于打开了这些隐藏特性的开关。
    • 当随后遇到 #include <stdio.h> 时,预处理器看到该宏已定义,就会把头文件里那些原本被 #ifdef 隐藏起来的扩展函数声明(比如 asprintf)放出来供程序使用。

常用工具

Make 构建工具

  • 作用: make 允许用户递增地对一组程序模块进行重新编译。它只重新编译那些自上次编译后被修改过的源文件,这有助于节省时间并避免手动编译时的遗漏错误。
  • 描述文件 (Makefile): 通过编写 Makefile 来指定模块之间的依赖关系和编译规则。
  • 执行规则:
    • 可以在命令行中指定目标(如 make clean),此时 make 只更新指定的目标。
    • 如果没有显式指定目标,make 默认只检查并执行描述文件中的第一个目标。通常习惯将第一个目标命名为 all,并让它依赖所有其他需要编译的目标。
    • 默认情况下,make 寻找名为 makefileMakefile 的文件。如果你的描述文件名字不同,可以使用带有 -f 参数的命令(如 make -f my_build_file)来指定。

Lint 静态分析工具

  • 作用: lint 工具用于在不运行程序的情况下,查找 C 源文件中的错误和不一致性(例如类型检查、检测不可达语句、指出可能多余的代码),通常建议为所有 C 程序调用 lint
  • 局限性与现状:
    • 默认配置通常过于严格(甚至连空格、排版都要管),把 Lint 配置成“只报真 Bug,不报废话”的状态非常困难,需要仔细阅读文档并一条条屏蔽规则。
    • 对于 C/C++ 等编译型语言,现代编译器已经接管了大部分类型检查工作。
    • Lint 工具找错误的价值,在 Python、JavaScript 这种解释型/动态类型语言中才会被无限放大,因为这些语言没有严格的编译阶段来帮你把关语法错误。

调试器与跟踪工具

  • 调试器 (Debuggers): 用于在程序运行时监视和控制程序的执行。常见的 C/C++ 调试器有 dbxadbsdbgdb 等。
  • 系统调用跟踪 (truss / strace): 这类工具(在 Linux 上通常是 strace)用于跟踪程序执行过程中向操作系统发起的所有系统调用以及程序接收到的信号,是排查底层环境和权限问题的利器。

C语言拾遗

static 关键字的两种用法

static 关键字在 C 语言中根据修饰对象的不同,有完全不同的物理意义:

  1. 用在全局变量或函数上(改变链接属性 / 作用域):
    • 将该变量/函数的作用域从”大家都能用“限制为“只有本文件能用”。主要用于防止不同文件之间的命名冲突。
  2. 用在局部变量上(改变生命周期):
    • 将该变量的存储位置从栈区(Stack)移到静态数据区。其生命周期从“函数结束就销毁”变成了**“在程序运行的持续时间内一直存在”**。
    • 当函数被再次调用时,该变量不仅不会被重新初始化,还会保留上一次调用结束时的值

Edit page