如何将字节数组转换为十六进制字符串,反之亦然?


当前回答

为什么要让它变得复杂?这在Visual Studio 2008中很简单:

C#:

string hex = BitConverter.ToString(YourByteArray).Replace("-", "");

VB:

Dim hex As String = BitConverter.ToString(YourByteArray).Replace("-", "")

其他回答

用@CodesInChaus补充答案(反向方法)

public static byte[] HexToByteUsingByteManipulation(string s)
{
    byte[] bytes = new byte[s.Length / 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        int hi = s[i*2] - 65;
        hi = hi + 10 + ((hi >> 31) & 7);

        int lo = s[i*2 + 1] - 65;
        lo = lo + 10 + ((lo >> 31) & 7) & 0x0f;

        bytes[i] = (byte) (lo | hi << 4);
    }
    return bytes;
}

说明:

&0x0f还支持小写字母

hi=hi+10+((hi>>31)&7);与以下内容相同:

hi=ch-65+10+((ch-65)>>31)&7);

对于“0”9’与hi=ch-65+10+7相同;其为hi=ch-48(这是因为0xffffff&7)。

对于“A”F’为hi=ch-65+10;(这是因为0x00000000&7)。

对于“a”我们必须使用大数字,所以我们必须通过使用&0x0f使某些位为0,从默认版本中减去32。

65是“A”的代码

48是“0”的代码

7是ASCII表中“9”和“A”之间的字母数(…456789:;<=>?@ABCD…)。

性能分析

注:2015-08-20新领导。

我通过一些粗略的Stopwatch性能测试运行了各种转换方法,一次使用随机语句(n=61,1000次迭代),另一次使用Project Gutenburg文本(n=1238957,150次迭代)。以下是结果,大致从最快到最慢。所有测量值都以刻度为单位(10000刻度=1毫秒),所有相关注释都与[最慢]StringBuilder实现进行比较。对于所使用的代码,请参阅下面的测试框架repo,我现在在那里维护运行该代码。

免责声明

警告:不要依赖这些统计数据来获取任何具体信息;它们只是样本数据的一个样本运行。如果您确实需要一流的性能,请在代表您生产需求的环境中测试这些方法,并使用代表您将使用的数据。

后果

按字节不安全查找(通过CodesInChaos)(通过空气呼吸器添加到测试报告中)文本:4727.85(105.2X)句子:0.28(99.7X)按字节查找(通过CodesInChaos)文本:10853.96(速度快45.8倍)句子:0.65(快42.7X)字节操作2(通过CodesInChaos)文本:12967.69(38.4X更快)句子:0.73(快37.9倍)字节操作(通过Waleed Eissa)文本:16856.64(快29.5倍)句子:0.70(快39.5倍)查找/轮班(通过Nathan Moinvaziri)文本:23201.23(速度快21.4倍)句子:1.24(快22.3倍)通过半字节查找(通过Brian Lambert)文本:23879.41(速度加快20.8倍)句子:1.15(快23.9倍)BitConverter(通过Tomalak)文本:113269.34(速度快4.4倍)句子:9.98(快2.8倍){SoapHexBinary}.ToString(通过Mykroft)文本:178601.39(速度快2.8倍)句子:10.68(快2.6倍){byte}.ToString(“X2”)(使用foreach)(源自Will Dean的答案)文本:308805.38(速度快2.4倍)句子:16.89(快2.4倍){byte}.ToString(“X2”)(使用{IEnumerable}.Agregate,需要System.Linq)(通过Mark)文本:352828.20(快2.1倍)句子:16.87(快2.4倍)Array.ConvertAll(使用string.Join)(通过Will Dean)文本:675451.57(快1.1倍)句子:17.95(快2.2倍)Array.ConvertAll(使用string.Concat,需要.NET 4.0)(通过Will Dean)文本:752078.70(速度快1.0倍)句子:18.28(快2.2倍){StringBuilder}.AppendFormat(使用foreach)(通过Tomalak)文本:672115.77(快1.1倍)句子:36.82(快1.1倍){StringBuilder}.AppendFormat(使用{IEnumerable}.Agregate,需要System.Linq)(源自Tomalak的答案)文本:718380.63(速度快1.0倍)句子:39.71(快1.0X)

查找表已经领先于字节操作。基本上,有某种形式的预先计算任何给定的半字节或字节将是十六进制的。然后,当您读取数据时,只需查找下一部分,看看它是什么十六进制字符串。然后以某种方式将该值添加到结果字符串输出中。在很长一段时间里,字节操作是性能最好的方法,而某些开发人员可能更难阅读。

您最好的选择仍然是找到一些具有代表性的数据,并在类似于生产的环境中进行测试。如果您有不同的内存限制,您可能更喜欢分配更少的方法,而不是更快但消耗更多内存的方法。

测试代码

请随意使用我使用的测试代码。此处包含一个版本,但您可以随意克隆回购并添加自己的方法。如果您发现任何有趣的东西或希望帮助改进它使用的测试框架,请提交一个拉取请求。

将新的静态方法(Func<byte[],string>)添加到/Tests/ConvertByteArrayToHexString/Test.cs。将该方法的名称添加到同一类中的TestCandidate返回值中。通过切换同一类中GenerateTestInput中的注释,确保您正在运行所需的输入版本(句子或文本)。单击F5并等待输出(/bin文件夹中也会生成HTML转储)。

static string ByteArrayToHexStringViaStringJoinArrayConvertAll(byte[] bytes) {
    return string.Join(string.Empty, Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaStringConcatArrayConvertAll(byte[] bytes) {
    return string.Concat(Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaBitConverter(byte[] bytes) {
    string hex = BitConverter.ToString(bytes);
    return hex.Replace("-", "");
}
static string ByteArrayToHexStringViaStringBuilderAggregateByteToString(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.Append(b.ToString("X2"))).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachByteToString(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.Append(b.ToString("X2"));
    return hex.ToString();
}
static string ByteArrayToHexStringViaStringBuilderAggregateAppendFormat(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.AppendFormat("{0:X2}", b)).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachAppendFormat(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.AppendFormat("{0:X2}", b);
    return hex.ToString();
}
static string ByteArrayToHexViaByteManipulation(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    byte b;
    for (int i = 0; i < bytes.Length; i++) {
        b = ((byte)(bytes[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(bytes[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}
static string ByteArrayToHexViaByteManipulation2(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
    }
    return new string(c);
}
static string ByteArrayToHexViaSoapHexBinary(byte[] bytes) {
    SoapHexBinary soapHexBinary = new SoapHexBinary(bytes);
    return soapHexBinary.ToString();
}
static string ByteArrayToHexViaLookupAndShift(byte[] bytes) {
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    string hexAlphabet = "0123456789ABCDEF";
    foreach (byte b in bytes) {
        result.Append(hexAlphabet[(int)(b >> 4)]);
        result.Append(hexAlphabet[(int)(b & 0xF)]);
    }
    return result.ToString();
}
static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_Lookup32, GCHandleType.Pinned).AddrOfPinnedObject();
static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes) {
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result) {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++) {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}
static uint[] _Lookup32 = Enumerable.Range(0, 255).Select(i => {
    string s = i.ToString("X2");
    return ((uint)s[0]) + ((uint)s[1] << 16);
}).ToArray();
static string ByteArrayToHexViaLookupPerByte(byte[] bytes) {
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = _Lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}
static string ByteArrayToHexViaLookup(byte[] bytes) {
    string[] hexStringTable = new string[] {
        "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F",
        "10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F",
        "20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F",
        "30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F",
        "40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F",
        "50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F",
        "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F",
        "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
        "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F",
        "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F",
        "A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF",
        "B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF",
        "C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF",
        "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF",
        "E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF",
        "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF",
    };
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes) {
        result.Append(hexStringTable[b]);
    }
    return result.ToString();
}

更新(2010-01-13)

添加了瓦利德对分析的回答。速度相当快。

更新(2011-10-05)

为了完整性,添加了string.Concat Array.ConvertAll变量(需要.NET 4.0)。与string.Join版本相同。

更新(2012-02-05)

测试回购包括更多变体,如StringBuilder.Append(b.ToString(“X2”))。没有一个会影响结果。foreach比{IEnumerable}更快。例如,Aggregate,但BitConverter仍然获胜。

更新(2012-04-03)

将Mykroft的SoapHexBinary答案添加到分析中,获得第三名。

更新(2013-01-15)

增加了CodesInChaos的字节操作答案,该答案占据了第一位(在大块文本上有很大的空白)。

更新(2013-05-23)

添加了Nathan Moinvaziri的查找答案和Brian Lambert博客中的变体。两者都相当快,但在我使用的测试机器(AMD Phenom 9750)上没有领先。

更新(2014-07-31)

添加了@CodesInChaos基于字节的新查找答案。它似乎在句子测试和全文测试中都处于领先地位。

更新(2015-08-20)

将空气助燃器的优化和不安全变体添加到这个答案的repo中。如果你想在不安全的游戏中玩,你可以在短字符串和大文本上比之前的任何一个冠军获得巨大的性能提升。

您可以使用BitConverter.ToString方法:

byte[] bytes = {0, 1, 2, 4, 8, 16, 32, 64, 128, 256}
Console.WriteLine( BitConverter.ToString(bytes));

输出:

00-01-02-04-08-10-20-40-80-FF

更多信息:BitConverter.ToString方法(Byte[])

两个mashup,将两个半字节操作合并为一个。

可能非常有效的版本:

public static string ByteArrayToString2(byte[] ba)
{
    char[] c = new char[ba.Length * 2];
    for( int i = 0; i < ba.Length * 2; ++i)
    {
        byte b = (byte)((ba[i>>1] >> 4*((i&1)^1)) & 0xF);
        c[i] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string( c );
}

Decadent linq与比特黑客版本:

public static string ByteArrayToString(byte[] ba)
{
    return string.Concat( ba.SelectMany( b => new int[] { b >> 4, b & 0xF }).Select( b => (char)(55 + b + (((b-10)>>31)&-7))) );
}

并反转:

public static byte[] HexStringToByteArray( string s )
{
    byte[] ab = new byte[s.Length>>1];
    for( int i = 0; i < s.Length; i++ )
    {
        int b = s[i];
        b = (b - '0') + ((('9' - b)>>31)&-7);
        ab[i>>1] |= (byte)(b << 4*((i&1)^1));
    }
    return ab;
}

在编写加密代码时,通常避免依赖数据的分支和表查找,以确保运行时不依赖于数据,因为依赖数据的计时可能会导致侧通道攻击。

它也很快。

static string ByteToHexBitFiddle(byte[] bytes)
{
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b-10)>>31)&-7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string(c);
}

Ph'nglui mglw'naph Cthulhu R'lieh wgah'nagl fhtagn公司


你们这些进入这里的人,放弃一切希望吧

一个奇怪的拨弄解释:

bytes[i]>>4提取字节的高位半字节bytes[i]&0xF提取字节的低位半字节b-10对于值b<10,为<0,将变为十进制数字对于值b>10,为>=0,这将成为从a到F的字母。在有符号32位整数上使用i>>31可以提取符号,这得益于符号扩展。当i<0时为-1,当i>=0时为0。结合2)和3),表明(b-10)>>31将是字母0,数字-1。看看字母的大小写,最后一个被加数变为0,b在10到15的范围内。我们希望将其映射到A(65)到F(70),这意味着添加55('A'-10)。看看数字的情况,我们希望调整最后一个被加数,使其将b从范围0到9映射到范围0(48)到9(57)。这意味着它需要变为-7('0'-55)。现在我们可以乘以7。但由于-1由所有位表示为1,因此我们可以改用&-7,因为(0&-7)==0和(-1&-7)==-7。

进一步考虑:

我没有使用第二个循环变量来索引c,因为测量表明从I计算它更便宜。正好使用i<bytes.Length作为循环的上限允许JITter消除对bytes[i]的边界检查,所以我选择了这个变量。将b设为int允许不必要的从和到字节的转换。