如何在C和c++中将字符转换为int ?


当前回答

(这个答案解决了c++方面的问题,但C中也存在符号扩展问题。)

处理所有三种char类型(有符号、无符号和char)比最初看起来更精细。0到SCHAR_MAX(对于8位字符是127)范围内的值很容易:

char c = somevalue;
signed char sc = c;
unsigned char uc = c;
int n = c;

但是,当somevalue超出该范围时,只有通过unsigned char才能在所有三种类型中获得“相同”char值的一致结果:

char c = somevalue;
signed char sc = c;
unsigned char uc = c;
// Might not be true: int(c) == int(sc) and int(c) == int(uc).
int nc = (unsigned char)c;
int nsc = (unsigned char)sc;
int nuc = (unsigned char)uc;
// Always true: nc == nsc and nc == nuc.

这在使用ctype.h中的函数时很重要,例如isupper或toupper,因为符号扩展:

char c = negative_char;  // Assuming CHAR_MIN < 0.
int n = c;
bool b = isupper(n);  // Undefined behavior.

注意到int的转换是隐式的;这有相同的UB:

char c = negative_char;
bool b = isupper(c);

要解决这个问题,使用unsigned char,这很容易通过safe_ctype包装ctype.h函数:

template<int (&F)(int)>
int safe_ctype(unsigned char c) { return F(c); }

//...
char c = CHAR_MIN;
bool b = safe_ctype<isupper>(c);  // No UB.

std::string s = "value that may contain negative chars; e.g. user input";
std::transform(s.begin(), s.end(), s.begin(), &safe_ctype<toupper>);
// Must wrap toupper to eliminate UB in this case, you can't cast
// to unsigned char because the function is called inside transform.

这是可行的,因为任何接受三种char类型中的任何一种的函数也可以接受另外两种char类型。它导致两个可以处理任何类型的函数:

int ord(char c) { return (unsigned char)c; }
char chr(int n) {
  assert(0 <= n);  // Or other error-/sanity-checking.
  assert(n <= UCHAR_MAX);
  return (unsigned char)n;
}

// Ord and chr are named to match similar functions in other languages
// and libraries.

Ord (c)总是给你一个非负值-即使传递一个负字符或负符号字符- CHR取Ord产生的任何值并返回完全相同的字符。

在实践中,我可能只使用unsigned char类型而不是使用这些类型,但它们确实简洁地包装了类型转换,提供了一个方便的地方来添加int-to-char类型的错误检查,并且在需要多次使用它们时更简短、更清楚。

其他回答

C和c++总是将类型提升到至少int。此外,字符字面量在C中是int类型,在c++中是char类型。

可以通过赋值给int类型来转换char类型。

char c = 'a'; // narrowing on C
int a = c;

想必您需要这种转换来使用C标准库中的函数。

在这种情况下,do (c++语法)

typedef unsigned char UChar;

char myCppFunc( char c )
{
    return char( someCFunc( UChar( c ) ) );
}

表达式UChar(c)转换为unsigned char以消除负值,除了EOF外,c函数不支持负值。

然后,该表达式的结果被用作int形式参数的实际参数。你会自动提升到int。您也可以显式地编写最后一步,如int(UChar(c)),但我个人认为这太啰嗦了。

干杯!

使用static_cast < int >:

int num = static_cast<int>(letter); // if letter='a', num=97

编辑:你可能应该尽量避免使用(int)

Int num = (Int)字母;

为什么使用static_cast<int>(x)而不是(int)x?更多信息。

嗯,在ASCII码中,数字(数字)从48开始。你所需要做的就是:

int x = (int)character - 48;

或者,因为字符'0'的ASCII码是48,你可以这样写:

int x = character - '0';  // The (int) cast is not necessary.

我在C语言中有绝对的零技能,但对于一个简单的解析:

char* something = "123456";

int number = parseInt(something);

...这招对我很管用:

int parseInt(char* chars)
{
    int sum = 0;
    int len = strlen(chars);
    for (int x = 0; x < len; x++)
    {
        int n = chars[len - (x + 1)] - '0';
        sum = sum + powInt(n, x);
    }
    return sum;
}

int powInt(int x, int y)
{
    for (int i = 0; i < y; i++)
    {
        x *= 10;
    }
    return x;
}