C标准保证size_t是一种可以保存任何数组下标的类型。这意味着,从逻辑上讲,size_t应该能够保存任何指针类型。我在一些网站上读到,我在谷歌上发现这是合法的,并且/或应该总是有效的:

void *v = malloc(10);
size_t s = (size_t) v;

所以在C99中,标准引入了intptr_t和uintptr_t类型,它们是有符号和无符号类型,保证能够保存指针:

uintptr_t p = (size_t) v;

那么使用size_t和uintptr_t之间的区别是什么?两者都是无符号的,并且都应该能够保存任何指针类型,因此它们在功能上似乎是相同的。是否有任何真正令人信服的理由使用uintptr_t(或更好的是,一个void *)而不是size_t,除了清晰度?在不透明结构中,字段将仅由内部函数处理,是否有理由不这样做?

出于同样的原因,ptrdiff_t是一个能够保存指针差异的有符号类型,因此能够保存大多数任何指针,那么它与intptr_t有什么不同呢?

所有这些类型不都是服务于同一个函数的不同版本吗?如果不是,为什么?有什么是我用其中一个不能做而另一个不能做的?如果是这样,为什么C99要在语言中添加两个本质上多余的类型?

我愿意忽略函数指针,因为它们不适用于当前的问题,但可以随意提及它们,因为我怀疑它们将是“正确”答案的核心。


当前回答

Size_t是一种可以保存任何数组下标的类型。这意味着, 逻辑上,size_t应该能够 保留任何指针类型

不一定!例如,回到分段16位架构的时代:一个数组可能被限制在单个段(因此16位的size_t就可以了),但你可以有多个段(因此需要一个32位的intptr_t类型来选择段以及其中的偏移量)。我知道这些事情在这些统一寻址的无分段架构的日子里听起来很奇怪,但是标准必须满足更广泛的多样性,而不是“2009年的正常情况”,你知道!-)

其他回答

int main(){
  int a[4]={0,1,5,3};
  int a0 = a[0];
  int a1 = *(a+1);
  int a2 = *(2+a);
  int a3 = 3[a];
  return a2;
}

这意味着intptr_t必须总是替代size_t,反之亦然。

关于段限制、奇异架构等推理,我将让所有其他答案代表它们自己。

名称上的简单差异难道不足以让我们用正确的类型来做正确的事情吗?

如果要存储一个大小,请使用size_t。如果要存储指针,请使用intptr_t。阅读您代码的人会立即知道“啊哈,这是一个大小的东西,可能以字节为单位”,以及“哦,这里有一个指针值被存储为整数,出于某种原因”。

否则,你可以用unsigned long(或者,在现代,unsigned long long)来表示所有的东西。大小并不是一切,类型名称具有有用的含义,因为它有助于描述程序。

我认为(这适用于所有类型名)它可以更好地在代码中传达您的意图。

例如,即使unsigned short和wchar_t在Windows上是相同的大小(我认为),使用wchar_t而不是unsigned short表明您将使用它来存储宽字符,而不仅仅是某个任意数字。

Size_t是一种可以保存任何数组下标的类型。这意味着, 逻辑上,size_t应该能够 保留任何指针类型

不一定!例如,回到分段16位架构的时代:一个数组可能被限制在单个段(因此16位的size_t就可以了),但你可以有多个段(因此需要一个32位的intptr_t类型来选择段以及其中的偏移量)。我知道这些事情在这些统一寻址的无分段架构的日子里听起来很奇怪,但是标准必须满足更广泛的多样性,而不是“2009年的正常情况”,你知道!-)

回顾过去和未来,回想各种奇怪的架构分散在景观中,我很确定他们试图包装所有现有的系统,并提供所有可能的未来系统。

当然,事情解决的方式,到目前为止,我们不需要那么多类型。

但即使在LP64(一个相当常见的范例)中,我们也需要size_t和ssize_t作为系统调用接口。人们可以想象一个更受限制的遗留系统或未来系统,其中使用完整的64位类型是昂贵的,他们可能想要在大于4GB的I/O操作上下注,但仍然有64位指针。

我想你们会想:我们已经开发了什么,未来又会有什么。(也许是128位分布式系统互联网范围的指针,但在一次系统调用中不超过64位,或者甚至可能是“遗留的”32位限制。:-)想象一下遗留系统可能会得到新的C编译器…

另外,看看当时的情况。除了数不胜数的286实模式内存模型,CDC的60位字/ 18位指针大型机怎么样?克雷系列怎么样?不管正常的ILP64 LP64 LLP64。(我一直认为微软在LLP64上矫揉造作,它应该是P64。)我当然可以想象一个委员会试图涵盖所有基础……