C标准保证size_t是一种可以保存任何数组下标的类型。这意味着,从逻辑上讲,size_t应该能够保存任何指针类型。我在一些网站上读到,我在谷歌上发现这是合法的,并且/或应该总是有效的:

void *v = malloc(10);
size_t s = (size_t) v;

所以在C99中,标准引入了intptr_t和uintptr_t类型,它们是有符号和无符号类型,保证能够保存指针:

uintptr_t p = (size_t) v;

那么使用size_t和uintptr_t之间的区别是什么?两者都是无符号的,并且都应该能够保存任何指针类型,因此它们在功能上似乎是相同的。是否有任何真正令人信服的理由使用uintptr_t(或更好的是,一个void *)而不是size_t,除了清晰度?在不透明结构中,字段将仅由内部函数处理,是否有理由不这样做?

出于同样的原因,ptrdiff_t是一个能够保存指针差异的有符号类型,因此能够保存大多数任何指针,那么它与intptr_t有什么不同呢?

所有这些类型不都是服务于同一个函数的不同版本吗?如果不是,为什么?有什么是我用其中一个不能做而另一个不能做的?如果是这样,为什么C99要在语言中添加两个本质上多余的类型?

我愿意忽略函数指针,因为它们不适用于当前的问题,但可以随意提及它们,因为我怀疑它们将是“正确”答案的核心。


当前回答

关于段限制、奇异架构等推理,我将让所有其他答案代表它们自己。

名称上的简单差异难道不足以让我们用正确的类型来做正确的事情吗?

如果要存储一个大小,请使用size_t。如果要存储指针,请使用intptr_t。阅读您代码的人会立即知道“啊哈,这是一个大小的东西,可能以字节为单位”,以及“哦,这里有一个指针值被存储为整数,出于某种原因”。

否则,你可以用unsigned long(或者,在现代,unsigned long long)来表示所有的东西。大小并不是一切,类型名称具有有用的含义,因为它有助于描述程序。

其他回答

关于你的声明:

C标准保证size_t是一种可以保存任何数组下标的类型。这意味着,从逻辑上讲,size_t应该能够保存任何指针类型。”

这实际上是一个谬论(由不正确的推理引起的误解)(a)。你可能认为后者源于前者,但事实并非如此。

指针和数组下标不是一回事。设想一个符合规范的实现,将数组限制在65536个元素,但允许指针将任何值寻址到一个巨大的128位地址空间,这是相当合理的。

C99声明size_t变量的上限由SIZE_MAX定义,它可以低至65535(参见C99 TR3, 7.18.3,在C11中不变)。在现代系统中,如果指针被限制在这个范围内,那么它们将受到相当的限制。

在实践中,您可能会发现您的假设成立,但这并不是因为标准保证了这一点。因为它并不能保证。


(a)顺便说一下,这不是某种形式的人身攻击,只是在批判性思维的背景下说明为什么你的陈述是错误的。例如,下面的推理也是无效的:

所有的小狗都很可爱。这东西很可爱。所以这东西一定是一只小狗。

小狗的可爱与否在这里没有任何关系,我只是说这两个事实并不能得出结论,因为前两句话允许存在可爱的东西,而不是小狗。

这类似于你的第一个陈述,但不一定要求第二个。

Size_t是一种可以保存任何数组下标的类型。这意味着, 逻辑上,size_t应该能够 保留任何指针类型

不一定!例如,回到分段16位架构的时代:一个数组可能被限制在单个段(因此16位的size_t就可以了),但你可以有多个段(因此需要一个32位的intptr_t类型来选择段以及其中的偏移量)。我知道这些事情在这些统一寻址的无分段架构的日子里听起来很奇怪,但是标准必须满足更广泛的多样性,而不是“2009年的正常情况”,你知道!-)

我认为(这适用于所有类型名)它可以更好地在代码中传达您的意图。

例如,即使unsigned short和wchar_t在Windows上是相同的大小(我认为),使用wchar_t而不是unsigned short表明您将使用它来存储宽字符,而不仅仅是某个任意数字。

int main(){
  int a[4]={0,1,5,3};
  int a0 = a[0];
  int a1 = *(a+1);
  int a2 = *(2+a);
  int a3 = 3[a];
  return a2;
}

这意味着intptr_t必须总是替代size_t,反之亦然。

最大数组的大小可能小于指针。想想分段体系结构——指针可能是32位的,但单个段可能只能寻址64KB(例如旧的实模式8086体系结构)。

虽然这些在桌面计算机中已经不常用了,但C标准旨在支持甚至是小型的、专门的体系结构。例如,仍有嵌入式系统正在开发8位或16位cpu。