我有一个嵌入比特码术语的问题。 什么是内嵌位码? 何时启用,ENABLE_BITCODE在新的Xcode? 在Xcode 7中启用ENABLE_BITCODE时,二进制会发生什么?


当前回答

由于确切的问题是“启用位码做什么”,我想给出一些迄今为止我弄清楚的技术细节。在苹果发布这个编译器的源代码之前,大部分问题实际上是不可能100%确定的

首先,苹果的位码似乎与LLVM字节码不是一回事。至少,我还没发现他们之间有什么相似之处。它似乎有一个专有的报头(总是以“xar!”开头),可能还有一些防止数据重复的链接时引用魔法。如果写出硬编码的字符串,则该字符串只会放入数据一次,而不是像普通LLVM字节码那样放入两次。

其次,位码并没有像预期的那样真正作为一个单独的体系结构在二进制存档中发布。它的发布方式与x86和ARM被放入一个二进制文件(FAT存档)的方式不同。相反,它们使用架构特定的MachO二进制文件中名为“__LLVM”的特殊部分,该部分随支持的每个架构一起发布(即复制)。我认为这是一个短来与他们的编译器系统,可能会在未来修复,以避免重复。

C代码(用clang -fembed-bitcode hi.c -S -emit-llvm编译):

#include <stdio.h>

int main() {
    printf("hi there!");
    return 0;
}

LLVM IR输出:

; ModuleID = '/var/folders/rd/sv6v2_f50nzbrn4f64gnd4gh0000gq/T/hi-a8c16c.bc'
target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-apple-macosx10.10.0"

@.str = private unnamed_addr constant [10 x i8] c"hi there!\00", align 1
@llvm.embedded.module = appending constant [1600 x i8] c"\DE\C0\17\0B\00\00\00\00\14\00\00\00$\06\00\00\07\00\00\01BC\C0\DE!\0C\00\00\86\01\00\00\0B\82 \00\02\00\00\00\12\00\00\00\07\81#\91A\C8\04I\06\1029\92\01\84\0C%\05\08\19\1E\04\8Bb\80\10E\02B\92\0BB\84\102\148\08\18I\0A2D$H\0A\90!#\C4R\80\0C\19!r$\07\C8\08\11b\A8\A0\A8@\C6\F0\01\00\00\00Q\18\00\00\C7\00\00\00\1Bp$\F8\FF\FF\FF\FF\01\90\00\0D\08\03\82\1D\CAa\1E\E6\A1\0D\E0A\1E\CAa\1C\D2a\1E\CA\A1\0D\CC\01\1E\DA!\1C\C8\010\87p`\87y(\07\80p\87wh\03s\90\87ph\87rh\03xx\87tp\07z(\07yh\83r`\87th\07\80\1E\E4\A1\1E\CA\01\18\DC\E1\1D\DA\C0\1C\E4!\1C\DA\A1\1C\DA\00\1E\DE!\1D\DC\81\1E\CAA\1E\DA\A0\1C\D8!\1D\DA\A1\0D\DC\E1\1D\DC\A1\0D\D8\A1\1C\C2\C1\1C\00\C2\1D\DE\A1\0D\D2\C1\1D\CCa\1E\DA\C0\1C\E0\A1\0D\DA!\1C\E8\01\1D\00s\08\07v\98\87r\00\08wx\876p\87pp\87yh\03s\80\876h\87p\A0\07t\00\CC!\1C\D8a\1E\CA\01 \E6\81\1E\C2a\1C\D6\A1\0D\E0A\1E\DE\81\1E\CAa\1C\E8\E1\1D\E4\A1\0D\C4\A1\1E\CC\C1\1C\CAA\1E\DA`\1E\D2A\1F\CA\01\C0\03\80\A0\87p\90\87s(\07zh\83q\80\87z\00\C6\E1\1D\E4\A1\1C\E4\00 \E8!\1C\E4\E1\1C\CA\81\1E\DA\C0\1C\CA!\1C\E8\A1\1E\E4\A1\1C\E6\01X\83y\98\87y(\879`\835\18\07|\88\03;`\835\98\87y(\076X\83y\98\87r\90\036X\83y\98\87r\98\03\80\A8\07w\98\87p0\87rh\03s\80\876h\87p\A0\07t\00\CC!\1C\D8a\1E\CA\01 \EAa\1E\CA\A1\0D\E6\E1\1D\CC\81\1E\DA\C0\1C\D8\E1\1D\C2\81\1E\00s\08\07v\98\87r\006\C8\88\F0\FF\FF\FF\FF\03\C1\0E\E50\0F\F3\D0\06\F0 \0F\E50\0E\E90\0F\E5\D0\06\E6\00\0F\ED\10\0E\E4\00\98C8\B0\C3<\94\03@\B8\C3;\B4\819\C8C8\B4C9\B4\01<\BCC:\B8\03=\94\83<\B4A9\B0C:\B4\03@\0F\F2P\0F\E5\00\0C\EE\F0\0Em`\0E\F2\10\0E\EDP\0Em\00\0F\EF\90\0E\EE@\0F\E5 \0FmP\0E\EC\90\0E\ED\D0\06\EE\F0\0E\EE\D0\06\ECP\0E\E1`\0E\00\E1\0E\EF\D0\06\E9\E0\0E\E60\0Fm`\0E\F0\D0\06\ED\10\0E\F4\80\0E\809\84\03;\CCC9\00\84;\BCC\1B\B8C8\B8\C3<\B4\819\C0C\1B\B4C8\D0\03:\00\E6\10\0E\EC0\0F\E5\00\10\F3@\0F\E10\0E\EB\D0\06\F0 \0F\EF@\0F\E50\0E\F4\F0\0E\F2\D0\06\E2P\0F\E6`\0E\E5 \0Fm0\0F\E9\A0\0F\E5\00\E0\01@\D0C8\C8\C39\94\03=\B4\C18\C0C=\00\E3\F0\0E\F2P\0Er\00\10\F4\10\0E\F2p\0E\E5@\0Fm`\0E\E5\10\0E\F4P\0F\F2P\0E\F3\00\AC\C1<\CC\C3<\94\C3\1C\B0\C1\1A\8C\03>\C4\81\1D\B0\C1\1A\CC\C3<\94\03\1B\AC\C1<\CCC9\C8\01\1B\AC\C1<\CCC9\CC\01@\D4\83;\CCC8\98C9\B4\819\C0C\1B\B4C8\D0\03:\00\E6\10\0E\EC0\0F\E5\00\10\F50\0F\E5\D0\06\F3\F0\0E\E6@\0Fm`\0E\EC\F0\0E\E1@\0F\809\84\03;\CCC9\00\00I\18\00\00\02\00\00\00\13\82`B \00\00\00\89 \00\00\0D\00\00\002\22\08\09 d\85\04\13\22\A4\84\04\13\22\E3\84\A1\90\14\12L\88\8C\0B\84\84L\100s\04H*\00\C5\1C\01\18\94`\88\08\AA0F7\10@3\02\00\134|\C0\03;\F8\05;\A0\836\08\07x\80\07v(\876h\87p\18\87w\98\07|\88\038p\838\80\037\80\83\0DeP\0Em\D0\0Ez\F0\0Em\90\0Ev@\07z`\07t\D0\06\E6\80\07p\A0\07q \07x\D0\06\EE\80\07z\10\07v\A0\07s \07z`\07t\D0\06\B3\10\07r\80\07:\0FDH #EB\80\1D\8C\10\18I\00\00@\00\00\C0\10\A7\00\00 \00\00\00\00\00\00\00\868\08\10\00\02\00\00\00\00\00\00\90\05\02\00\00\08\00\00\002\1E\98\0C\19\11L\90\8C\09&G\C6\04C\9A\22(\01\0AM\D0i\10\1D]\96\97C\00\00\00y\18\00\00\1C\00\00\00\1A\03L\90F\02\134A\18\08&PIC Level\13\84a\D80\04\C2\C05\08\82\83c+\03ab\B2j\02\B1+\93\9BK{s\03\B9q\81q\81\01A\19c\0Bs;k\B9\81\81q\81q\A9\99q\99I\D9\10\14\8D\D8\D8\EC\DA\5C\DA\DE\C8\EA\D8\CA\5C\CC\D8\C2\CE\E6\A6\04C\1566\BB6\974\B227\BA)A\01\00y\18\00\002\00\00\003\08\80\1C\C4\E1\1Cf\14\01=\88C8\84\C3\8CB\80\07yx\07s\98q\0C\E6\00\0F\ED\10\0E\F4\80\0E3\0CB\1E\C2\C1\1D\CE\A1\1Cf0\05=\88C8\84\83\1B\CC\03=\C8C=\8C\03=\CCx\8Ctp\07{\08\07yH\87pp\07zp\03vx\87p \87\19\CC\11\0E\EC\90\0E\E10\0Fn0\0F\E3\F0\0E\F0P\0E3\10\C4\1D\DE!\1C\D8!\1D\C2a\1Ef0\89;\BC\83;\D0C9\B4\03<\BC\83<\84\03;\CC\F0\14v`\07{h\077h\87rh\077\80\87p\90\87p`\07v(\07v\F8\05vx\87w\80\87_\08\87q\18\87r\98\87y\98\81,\EE\F0\0E\EE\E0\0E\F5\C0\0E\EC\00q \00\00\05\00\00\00&`<\11\D2L\85\05\10\0C\804\06@\F8\D2\14\01\00\00a \00\00\0B\00\00\00\13\04A,\10\00\00\00\03\00\00\004#\00dC\19\020\18\83\01\003\11\CA@\0C\83\11\C1\00\00#\06\04\00\1CB\12\00\00\00\00\00\00\00\00\00\00\00\00\00\00\00", section "__LLVM,__bitcode"
@llvm.cmdline = appending constant [67 x i8] c"-triple\00x86_64-apple-macosx10.10.0\00-emit-llvm\00-disable-llvm-optzns\00", section "__LLVM,__cmdline"

; Function Attrs: nounwind ssp uwtable
define i32 @main() #0 {
  %1 = alloca i32, align 4
  store i32 0, i32* %1
  %2 = call i32 (i8*, ...)* @printf(i8* getelementptr inbounds ([10 x i8]* @.str, i32 0, i32 0))
  ret i32 0
}

declare i32 @printf(i8*, ...) #1

attributes #0 = { nounwind ssp uwtable "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="core2" "target-features"="+ssse3,+cx16,+sse,+sse2,+sse3" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="core2" "target-features"="+ssse3,+cx16,+sse,+sse2,+sse3" "unsafe-fp-math"="false" "use-soft-float"="false" }

!llvm.module.flags = !{!0}
!llvm.ident = !{!1}

!0 = !{i32 1, !"PIC Level", i32 2}
!1 = !{!"Apple LLVM version 7.0.0 (clang-700.0.53.3)"}

IR中的数据数组也会根据clang的优化和其他代码生成设置而变化。我完全不知道这是什么格式。

编辑:

根据推特上的提示,我决定重新审视并确认它。我跟随这篇博文,使用他的位码提取器工具从MachO可执行文件中获取了Apple Archive二进制文件。在用xar工具提取Apple Archive之后,我得到了这个(当然是用llvm-dis转换为文本)

; ModuleID = '1'
target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-apple-macosx10.10.0"

@.str = private unnamed_addr constant [10 x i8] c"hi there!\00", align 1

; Function Attrs: nounwind ssp uwtable
define i32 @main() #0 {
  %1 = alloca i32, align 4
  store i32 0, i32* %1
  %2 = call i32 (i8*, ...) @printf(i8* getelementptr inbounds ([10 x i8], [10 x i8]* @.str, i32 0, i32 0))
  ret i32 0
}

declare i32 @printf(i8*, ...) #1

attributes #0 = { nounwind ssp uwtable "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="core2" "target-features"="+ssse3,+cx16,+sse,+sse2,+sse3" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="core2" "target-features"="+ssse3,+cx16,+sse,+sse2,+sse3" "unsafe-fp-math"="false" "use-soft-float"="false" }

!llvm.module.flags = !{!0}
!llvm.ident = !{!1}

!0 = !{i32 1, !"PIC Level", i32 2}
!1 = !{!"Apple LLVM version 7.0.0 (clang-700.1.76)"}

非位码IR和位码IR之间唯一显著的区别是,每个架构的文件名都被剥离为1、2等。

我还确认了二进制中嵌入的位码是在优化后生成的。如果你使用-O3编译并提取出位码,它将与使用-O0编译不同。

为了获得额外的荣誉,我还确认,当你下载iOS 9应用程序时,苹果不会向设备发送位码。它们包括许多其他奇怪的部分,如__LINKEDIT,但它们不包括__LLVM。__bundle,因此在设备上运行的最终二进制文件中似乎不包括位码。奇怪的是,苹果仍然向iOS 8设备发送带有单独32/64位代码的肥大二进制文件。

其他回答

Bitcode指的是发送到iTunes Connect的代码类型:“LLVM Bitcode”。这允许苹果使用某些计算来进一步重新优化应用程序(例如:可能减小可执行文件的大小)。如果苹果需要修改你的可执行文件,那么他们可以在不上传新版本的情况下做到这一点。

这不同于: 切片,这是苹果根据用户设备的分辨率和架构优化应用程序的过程。切片不需要比特码。(例如:只包括5s上的@2x图像)

应用细化是切片、位码和按需资源的组合

位码是编译程序的中间表示形式。应用程序 你上传到iTunes Connect的包含位码的文件将被编译 链接到App Store。包括位码将允许苹果 重新优化您的应用程序二进制在未来,而不需要提交 应用商店的新版本。

关于应用程序细化的苹果文档

Bitcode (iOS, watchOS) 位码是编译程序的中间表示形式。你上传到iTunes Connect的包含比特码的应用程序将被编译并链接到App Store。包含位码将允许苹果在未来重新优化你的应用程序二进制,而无需向应用商店提交新版本的应用程序。

基本上,这个概念有点类似于java,在java中,字节代码运行在不同的JVM上,在这种情况下,位代码被放置在iTune商店中,而不是将中间代码提供给不同的平台(设备),它提供了不需要任何虚拟机运行的编译代码。

因此,我们需要一次创建位码,它将可用于现有或未来的设备。让苹果头疼的是如何使它与他们拥有的每个平台兼容。

开发者不需要做出改变并再次提交应用去支持新的平台。

让我们以iPhone 5s为例,当时苹果推出了x64芯片。虽然x86应用程序与x64架构完全兼容,但要充分利用x64平台,开发人员必须改变架构或一些代码。一旦他/她完成,应用就会提交到应用商店进行审查。

如果比特码的概念更早推出,那么我们开发人员就不需要做任何改变来支持x64位架构。

什么是内嵌位码?

根据文档:

位码是编译程序的中间表示形式。你上传到iTunes Connect的包含比特码的应用程序将被编译并链接到App Store。包含位码将允许苹果在未来重新优化你的应用程序二进制,而无需向应用商店提交新版本的应用程序。

更新:“Xcode 7的新功能”中的这句话让我思考了很长一段时间,切片需要比特码来减小应用程序的大小:

当你存档提交到App Store时,Xcode会将你的应用编译成一个中间表示。App Store将根据需要将位代码编译为64位或32位可执行文件。

然而这并不是真的,Bitcode和Slicing是独立工作的:Slicing是关于减少应用大小和生成应用包变量,而Bitcode是关于某些二进制优化。我已经通过检查非位代码应用程序的可执行文件中包含的架构来验证这一点,并发现它们只包含必要的架构。

Bitcode允许其他名为Slicing的应用细化组件为特定架构生成带有特定可执行文件的应用包变体,例如iPhone 5S变体将只包含arm64可执行文件,iPad Mini armv7等等。

什么时候在新的Xcode中启用ENABLE_BITCODE ?

对于iOS应用程序,bitcode是默认值,但可选。如果你提供了位码,那么应用程序包中的所有应用程序和框架都需要包含位码。对于watchOS和tvOS应用程序,位码是必需的。

当ENABLE_BITCODE在新的Xcode中启用时,二进制会发生什么?

来自Xcode 7参考:

激活此设置表明目标或项目应该在编译过程中为支持它的平台和体系结构生成位码。对于存档构建,位代码将在链接二进制文件中生成,以便提交到应用程序商店。对于其他构建,编译器和链接器将检查代码是否符合位码生成的要求,但不会生成实际的位码。

这里有几个链接,将有助于更深入地理解比特码:

Bitcode启发 为什么我没有启用比特码

更新

苹果公司已经澄清,切片与启用位码无关。我在实践中也观察到了这一点,即支持非比特码的应用程序只会作为适合目标设备的架构而下载。

原始

更具体地说:

Bitcode。存档你的应用,以便提交到应用商店 中间表示,它被编译成64位或32位 目标设备的可执行文件。 切片。合并到资产目录并标记为 这个平台允许App Store只提供需要的东西 安装。

在我看来,如果你支持位码,下载你的应用程序的人只会得到他们自己设备所需的编译结构。

Bitcode官方页面

[LLVM中的中间表示(IR)]有三种形式:

人类可读的汇编语言表示 内存编译器IR 位码(磁盘上的位码表示,位码文件格式,二进制格式)。

它是LLVM IR的位流(二进制编码)文件格式。它是LLVM IR序列化的结果。它可以有选择地嵌入到包装器或本机对象文件(Mach-O内原始段数据[关于])。它适用于即时编译器。 您可以使用llvm-dis将位码IR转换为人类可读的IR

苹果使用的另一个优势是可以在不引起开发人员注意的情况下为另一种(新)架构(指令集架构(ISA))重新编译二进制文件。另外,作为一个小的附加,你有可能逆向工程,这让苹果更容易分析二进制,但另一方面,这是一个缺点,可以被不法分子利用。它还增加了构建时间

当您构建位代码时,.BCSymbolMap[About]也会生成用于分析错误堆栈跟踪

请注意,模拟器不会生成位码(arch x86_64)。 Xcode在以下场景中使用位码:

国旗:

-fembed-bitcode -嵌入位代码 -fembed-bitcode-marker -只需标记它的位置。__LLVM段为空,没有任何数据

使用:

启用Bitcode (ENABLE_BITCODE)。是-是默认的应用程序,框架目标 使用-fembed-bitcode-marker进行常规构建 使用-fembed-bitcode在存档(Product ->存档)或(xcodebuild存档)中嵌入位代码 将标志显式添加到其他C标志(OTHER_CFLAGS) 自定义设置BITCODE_GENERATION_MODE Marker -添加-fembed-bitcode- Marker Bitcode -添加-fembed- Bitcode Xcodebuild与上面适当的选项

//please make sure that this settings is placed before xcodebuild params(.e.g. -workspace, -scheme...)
xcodebuild ENABLE_BITCODE=YES
//or
xcodebuild BITCODE_GENERATION_MODE="bitcode"
//or
xcodebuild OTHER_CFLAGS="-fembed-bitcode"

如果你在应用程序中使用嵌入位码,但不是所有库都支持它

ld: bitcode bundle could not be generated because '<path>' was built without full bitcode. All frameworks and dylibs for bitcode must be generated from Xcode Archive or Install build file '<path>' for architecture <arch>

检查二进制是否包含位码

位码必须存储在对象文件名为__LLVM的部分中,MachO为__bitcode,其他对象格式为.llvmbc。

Bitcode注入__LLVM段三个部分:__bitcode, __cmdline, __asm。苹果版本的LLVM使用了稍微不同的逻辑,并将__bitcode和__cmdline作为.xar存档移动到__bundle部分。

eXtensible ARchive(XAR) - . XAR, .pkg存档器的文件格式,由头文件、目录(toc)、堆组成。TOC是对存档文件的随机访问。xar中的每个文件都是独立压缩的

otool -l找到__LLVM __bundle。

你可以在Mach-O文件中查看段名和段名

但是它不能保证包含位码(例如。标记)

//<segname> <sectname> e.g. __LLVM __bundle. They are started from __

otool -l "/Users/alex/MyModule.framework/MyModule"
//or universal framework(specify arch)
otool -arch arm64 -l "/Users/alex/MyModule.framework/MyModule"
//or all arch
otool -arch all -l "/Users/alex/MyModule.framework/MyModule"

//-l print the load commands

输出:

Section
  sectname __bundle
   segname __LLVM
      addr 0x00000000000c0000
      size 0x00000000003af3ce
    offset 770048
...

otool -v -s __LLVM __bundle

otool -v -s __LLVM __bundle <binary_path>
//e.g.
otool -v -s __LLVM __bundle "/Users/alex/MyModule.framework/MyModule" 

// -s <segname> <sectname> print contents of section. e.g. -s __LLVM __bundle

// -v print verbosely (symbolically) when possible

输出otool -s __LLVM __bundle。它是位流(二进制编码)

Contents of (__LLVM,__bundle) section
00000000000b4000    21726178 01001c00 00000000 c60d0000 
00000000000b4010    00000000 be860000 01000000 9decda78 
00000000000b4020    b6dc735b f3dfc715 5f7a3429 bdc1ce2f 

输出otool -v -s __LLVM __bundle。它是XAR的目录(TOC)。-v将比特流(二进制编码)转换为XAR内容表(TOC)的XML格式

For (__LLVM,__bundle) section: xar table of contents:
<?xml version="1.0" encoding="UTF-8"?>
<xar>
 <subdoc subdoc_name="Ld">
  <version>1.0</version>
...

再生成一个指示器。bcsymbolmap[关于]

查找并提取位码

ebcutil

Closed source Library developer - XCFramework
App developer - enable bitcode

位码是强制的吗 官方

对于iOS应用程序,bitcode是默认值,但可选。对于watchOS和tvOS应用程序,位码是必需的。

二进制文件的大小

Bitcode增加二进制的大小,如果不是强制的,你可以使用bitcode_strip手动从二进制中删除Bitcode

例如

xcrun bitcode_strip -r "/Users/alex/MyModule.framework/MyModule" -o "/Users/alex/MyModule.framework/MyModule"

// -r remove bitcode
// -o output file name

(词汇)