今天来聊聊基础知识 | 每日一练（59） - V2CE

基础知识练习

士人有百折不回之真心，才有万变不穷之妙用。立业建功，事事要从实地着脚，若少慕声闻，便成伪果；讲道修德，念念要从虚处立基，若稍计功效，便落尘情。 ——菜根谭

学生：说真的, 真有机器用非零空指针吗, 或者不同类型用不同的表达？

小林：至少 PL/I, Prime 50 系列用段 07777, 偏移 0 作为空指针。后来的型号使用段0, 偏移 0 作为 C 的空指针, 迫使类似 TCNP (测试 C 空指针) 的指令明显地成了现成的作出错误猜想的蹩脚 C 代码。

旧些的按字寻址的 Prime 机器同样因为要求字节指针 (char *) 比字指针 (int *) 长而臭名昭著。Data General 的 Eclipse MV 系列支持三种结构的指针格式 (字、字节和比特指针), C 编译器使用了其中之二：char * 和 void * 使用字节指针, 而其它的使用字指针。

某些 Honeywell-Bull 大型机使用比特模式 06000 作为 (内部的) 空指针。CDC Cyber 180 系列使用包含环 (ring), 段和位移的 48 位指针。多数用户

(在环 11 上) 使用的空指针为 0xB00000000000。

在旧的 1 次补码的 CDC 机器上用全 1 表示各种数据, 包括非法指针, 是十分常见的事情。旧的 HP 3000 系列对字节地址和字地址使用不同的寻址模式; 正如上面的机器一样, 它因此也使用不同的形式表达 char * 和 void * 型指针及其它指针。

Symbolics Lisp 机器是一种标签结构, 它甚至没有传统的数字指针; 它使用<NIL, 0> 对 (通常是不存在的 <对象, 偏移> 句柄) 作为 C 空指针。

根据使用的 “内存模式”, 8086 系列处理器 (PC 兼容机) 可能使用 16 位的数据指针和 32 位的函数指针, 或者相反。

一些 64 位的 Cray 机器在一个字的低 48 位表示 int *; char * 使用高 16 位的某些位表示一个字节在一个字中的偏移。

学生：考虑到有关空指针的所有这些困惑, 难道把要求它们内部表达都必

须为 0 不是更简单吗？

小林：如果没有其它的原因, 这样做会是没脑筋的。因为它会不必要地限制某些实现, 阻止它们用特殊的非全零值表达空指针, 尤其是当那些值可以为非法访问引发自动的硬件陷阱的时候。

况且, 这样的要求真正完成了什么呢？对空指针的正确理解不需要内部表达的知识, 无论是零还是非零。

假设空指针内部表达为零不会使任何代码的编写更容易 (除了一些不动脑筋的 calloc() 调用)。用零作空指针的内部表达也不能消除在函数调用时的类型转换, 因为指针的大小可能和 int 型的大小依然不同。