我只是想知道我是否应该使用std::size_t for循环之类的东西,而不是int? 例如:
#include <cstdint>
int main()
{
for (std::size_t i = 0; i < 10; ++i) {
// std::size_t OK here? Or should I use, say, unsigned int instead?
}
}
一般来说,关于何时使用std::size_t的最佳实践是什么?
我只是想知道我是否应该使用std::size_t for循环之类的东西,而不是int? 例如:
#include <cstdint>
int main()
{
for (std::size_t i = 0; i < 10; ++i) {
// std::size_t OK here? Or should I use, say, unsigned int instead?
}
}
一般来说,关于何时使用std::size_t的最佳实践是什么?
当前回答
很快,大多数计算机将是64位体系结构,带有64位操作系统,运行在数十亿个元素的容器上的程序。然后必须使用size_t而不是int作为循环索引,否则在32位和64位系统上,索引将在2^32:th元素处换行。
为未来做好准备!
其他回答
一个很好的经验法则是,对于需要在循环条件中与std::size_t本身的东西进行比较的任何东西。
std::size_t是任何sizeof表达式的类型,as被保证能够在c++中表示任何对象(包括任何数组)的最大大小。通过扩展,它也保证足够大,可以用于任何数组下标,因此它是数组上按下标循环的自然类型。
如果你只是数到一个数字,那么使用保存该数字的变量类型或int或unsigned int(如果足够大)可能更自然,因为这些应该是机器的自然大小。
size_t类型是用来指定某个东西的大小,所以使用它是很自然的,例如,获取一个字符串的长度,然后处理每个字符:
for (size_t i = 0, max = strlen (str); i < max; i++)
doSomethingWith (str[i]);
当然,您必须注意边界条件,因为它是无符号类型。顶部的边界通常不那么重要,因为最大值通常很大(尽管有可能达到最大值)。大多数人只使用int型来处理这类事情,因为他们很少有足够大的结构或数组来超过int型的容量。
但要注意以下情况:
for (size_t i = strlen (str) - 1; i >= 0; i--)
这将导致一个无限循环,因为无符号值的包装行为(尽管我看到编译器警告反对这一点)。这也可以通过以下方法来缓解(稍难理解,但至少不会受到包装问题的影响):
for (size_t i = strlen (str); i-- > 0; )
通过将递减转换为延续条件的后检查副作用,这在递减之前对值进行了延续检查,但仍然在循环中使用递减后的值(这就是为什么循环从len ..1而不是镜头1 ..0)。
size_t是一种无符号类型,它可以为您的体系结构保存最大整数值,因此它不会因为符号(有符号int 0x7FFFFFFF加1会得到-1)或短大小(无符号短int 0xFFFF加1会得到0)而导致整数溢出。
它主要用于数组索引/循环/地址算法等。像memset()这样的函数只接受size_t,因为理论上你可能有一个大小为2^32-1的内存块(在32位平台上)。
对于这样简单的循环,不要麻烦,只使用int。
简短的回答:
几乎没有。使用signed版本ptrdiff_t或非标准的ssize_t。使用函数std::ssize代替std::size。
长一点的回答:
在32位系统中,当你需要一个大于2gb的char向量时。在所有其他用例中,使用有符号类型要比使用无符号类型安全得多。
例子:
std::vector<A> data;
[...]
// calculate the index that should be used;
size_t i = calc_index(param1, param2);
// doing calculations close to the underflow of an integer is already dangerous
// do some bounds checking
if( i - 1 < 0 ) {
// always false, because 0-1 on unsigned creates an underflow
return LEFT_BORDER;
} else if( i >= data.size() - 1 ) {
// if i already had an underflow, this becomes true
return RIGHT_BORDER;
}
// now you have a bug that is very hard to track, because you never
// get an exception or anything anymore, to detect that you actually
// return the false border case.
return calc_something(data[i-1], data[i], data[i+1]);
size_t的等效符号是ptrdiff_t,而不是int。但在大多数情况下,使用int仍然比使用size_t要好得多。Ptrdiff_t在32位和64位系统上是长值。
这意味着无论何时与std::容器交互,都必须从size_t转换到size_t,这不是很漂亮。但是在一个正在进行的本地会议上,c++的作者提到,用无符号的size_t来设计std::vector是一个错误。
如果你的编译器给出了从ptrdiff_t到size_t的隐式转换的警告,你可以通过构造函数语法将其显式化:
calc_something(data[size_t(i-1)], data[size_t(i)], data[size_t(i+1)]);
如果只是想迭代一个集合,没有边界检查,使用基于范围的for:
for(const auto& d : data) {
[...]
}
这里是Bjarne Stroustrup (c++作者)关于本地化的一些话
对于一些人来说,STL中的有符号/无符号设计错误是足够的理由,不使用std::vector,而是使用自己的实现。
Size_t由各种库返回,以指示该容器的大小非零。你用它当你得到一次:0
然而,在上面的例子中,循环size_t是一个潜在的错误。考虑以下几点:
for (size_t i = thing.size(); i >= 0; --i) {
// this will never terminate because size_t is a typedef for
// unsigned int which can not be negative by definition
// therefore i will always be >= 0
printf("the never ending story. la la la la");
}
使用无符号整数有可能产生这类微妙的问题。因此,依我之见,我更喜欢只在与需要size_t的容器/类型交互时使用size_t。