Go 编译
条件编译
Go 支持两种条件编译方式:
- 编译标签(build tag)
- 文件后缀
编译标签
编译标签是以 // +build
开头的注释,编译标签的规则:
- 空格表示:OR
- 逗号表示:AND
!
表示:NOT- 换行表示:AND
每个条件项的名字用 “字母+数字” 表示。主要支持以下几种条件:
- 操作系统,例如:
windows
、linux
等,对应runtime.GOOS
的值。 - 计算机架构,例如:
amd64
、386
,对应runtime.GOARCH
的值。 - 编译器,例如:
gccgo
、gc
,是否开启 CGO,cgo。 - Go 版本,例如:
go1.19
表示从 从 Go 版本 1.19 起,go1.20
表示从 从 Go 版本 1.20 起。 - 自定义的标签,例如:编译时通过指定
-tags
传入的值。 // +build ignore
,表示编译时自动忽略该文件
编译标签之后必须有空行,否则会被编译器当做普通注释。
// +build linux,386 darwin,!cgo
package testpkg
运算表达式为:(linux && 386) || (darwin && !cgo)
。
自定义 tag 只需要在 go build
指令后用 -tags
指定编译条件即可
go build -tags mytag1 mytag2
对于 -tags
,多个标签既可以用逗号分隔,也可以用空格分隔,但它们都表示"与"的关系。早期 go 版本用空格分隔,后来改成了用逗号分隔,但空格依然可以识别。
-tags
也有 !
规则,它表示的是没有这个标签。
// +build !hello
go build -tags=!hello
文件后缀
通过改变文件名的后缀来实现条件编译,如果源文件名包含后缀:_<GOOS>.go
,那么这个源文件只会在这个平台下编译,_<GOARCH>.go
也是如此。这两个后缀可以结合在一起使用,但是要注意顺序:_<GOOS>_<GOARCH>.go
, 不能反过来用。例如:
mypkg_freebsd_arm.go // only builds on freebsd/arm systems
mypkg_plan9.go // only builds on plan9
如果使用文件后缀,那么文件名就是必须的,否则会被编译器忽略,例如:
# 这个文件会被编译器忽略
_linux.go
选择编译标签还是文件后缀?
编译标签和文件后缀的功能上有重叠,例如一个文件 mypkg_linux.go
代码中又包含了 //go:build linux
,既有编译标签又有文件后缀,那就有些多余了。
通常情况下,如果源文件仅适配一个平台或者 CPU 架构,那么只使用文件后缀就可以满足,例如:
mypkg_linux.go // only builds on linux systems
mypkg_windows_amd64.go // only builds on windows 64bit platforms
像下面稍微复杂的场景,就需要使用编译标签:
- 这个源文件可以在超过一个平台或者超过一个 CPU 架构
- 需要排除某个平台或架构
- 有一些自定义的编译条件
go:build
//go:build
功能和 // +build
一样。只不过 //go:build
是在 go 1.17 才引入的。目的是为了与其他现有的 Go 指令保持一致,例如 //go:generate
。
规则: 由 ||
、&&
、!
运算符(或、与、非)和括号组成的表达式,//go:build ignore
,表示编译时自动忽略该文件。
例如 //go:build (linux && 386) || (darwin && !cgo)
,表示目标系统是 386 的 linux 或者没有启用 cgo 的 darwin 时,当前文件会被编译进来。
交叉编译
Go 可以通过设置环境变量来实现交叉编译,用来在一个平台上生成另一个平台的可执行程序:
# linux amd64
GOOS=linux GOARCH=amd64 go build main.go
# windows amd64
GOOS=windows GOARCH=amd64 go build main.go
环境变量 GOOS
设置平台, GOARCH
设置架构。
编译选项
go build [-o output] [-i] [build flags] [packages]
-a
强制重新编译所有包-n
把需要执行的编译命令打印出来,但是不执行,这样就可以很容易的知道底层是如何运行的-p n
指定可以并行可运行的编译数目,默认是 CPU 的数目-o
指定输出的可执行文件的文件名,可以带路径,例如go build -o a/b/c
-i
安装相应的包,编译并且go install
-race
开启编译的时候自动检测数据竞争的情况,目前只支持 64 位的机器-v
打印出来我们正在编译的包名-work
打印出来编译时候的临时文件夹名称,并且如果已经存在的话就不要删除-x
打印出来执行的命令,其实就是和-n的结果类似,只是这个会执行-ccflags 'arg list'
传递参数给 5c, 6c, 8c 调用-compiler name
指定相应的编译器,gccgo 还是 gc-gccgoflags 'arg list'
传递参数给 gccgo 编译连接调用-gcflags 'arg list'
编译器参数-installsuffix suffix
为了和默认的安装包区别开来,采用这个前缀来重新安装那些依赖的包,-race
的时候默认已经是-installsuffix race
,大家可以通过-n
命令来验证-ldflags 'arg list'
链接器参数-tags 'tag list'
设置在编译的时候可以适配的那些tag,详细的tag限制参考里面的 Build Constraints
gcflags
-gcflags
参数的格式是
-gcflags="pattern=arg list"
pattern
pattern 是选择包的模式,它可以有以下几种定义:
main
: 表示main
函数所在的顶级包路径all
: 表示GOPATH
中的所有包。如果是go modules
模式,则表示主模块和它所有的依赖,包括test
文件的依赖std
: 表示 Go 标准库中的所有包...
:...
是一个通配符,可以匹配任意字符串(包括空字符串)。net/...
表示 net 模块和它的所有子模块./...
表示当前主模块和所有子模块- 如果 pattern 中包含了
/
和...
,那么就不会匹配vendor
目录 例如:./...
不会匹配./vendor
目录。可以使用./vendor/...
匹配vendor
目录和它的子模块
go help packages
查看模式说明。
arg list
空格分隔,如果编译选项中含有空格,可以使用引号包起来。
-N
: 禁止编译器优化-l
: 关闭内联 (inline
)-c
:int
编译过程中的并发数,默认是1
-B
禁用越界检查-u
禁用 unsafe-S
输出汇编代码-m
输出优化信息
ldflags
-s
禁用符号表-w
禁用 DRAWF 调试信息-X
设置字符串全局变量值-X ver="0.99"
-H
设置可执行文件格式-H windowsgui
内联优化(inline)
内联优化就是在编译期间,直接将调用函数的地方替换为函数的实现,它可以减少函数调用的开销(创建栈帧,读写寄存器,栈溢出检测等)以提高程序的性能。因为优化的对象为函数,所以也叫函数内联。
内联是一个递归的过程,一旦一个函数被内联到它的调用者中,编译器就可能将产生的代码内联到它的调用者中,依此类推。
内联优化示例:
func f() {
fmt.Println("inline")
}
func a() {
f()
}
func b() {
f()
}
内联优化后:
func a() {
fmt.Println("inline")
}
func b() {
fmt.Println("inline")
}
内联优化的效果
package inlinetest
//go:noinline
func max(a, b int) int {
if a > b {
return a
}
return b
}
max_test.go
:
package inlinetest
import "testing"
var Result int
func BenchmarkMax(b *testing.B) {
var r int
for i := 0; i < b.N; i++ {
r = max(-1, i)
}
Result = r
}
现在是在禁用内联优化的情况下运行基准测试:
$ go test -bench=.
cpu: Intel(R) Core(TM) i7-10850H CPU @ 2.70GHz
BenchmarkMax-12 871122506 1.353 ns/op
去掉 //go:noinline
后(可以使用 go build -gcflags="-m -m" main.go
来查看编译器的优化)再次运行基准测试:
$ go test -bench=.
cpu: Intel(R) Core(TM) i7-10850H CPU @ 2.70GHz
BenchmarkMax-12 1000000000 0.3534 ns/op
对比两次基准测试的结果,1.353ns
和 0.3534ns
。打开内联优化的情况下,性能提高了 75%。
禁用内联
Go 编译器默认开启内联优化,可以使用 -gcflags="-l"
来关闭。但是如果传递两个或两个以上的 -l
则会打开内联,并启用更激进的内联策略:
-gcflags="-l -l"
2 级内联-gcflags="-l -l -l"
3 级内联gcflags=-l=4
4 级别内联
//go:noinline
编译指令,可以禁用单个函数的内联:
//go:noinline
func max(x, y int) int {
if x > y {
return x
}
return y
}
减小编译体积
Go 编译器默认编译出来的程序会带有符号表和调试信息,一般来说 release 版本可以去除调试信息以减小二进制体积。
使用 -w
和 -s
来减少可执行文件的体积。但删除了调试信息后,可执行文件将无法使用 gdb/dlv 调试:
go build -ldflags="-w -s" ./abc.go
使用 upx
upx 是一个常用的压缩动态库和可执行文件的工具,通常可减少 50-70% 的体积。
下载 upx 后解压就可以使用了。
# 使用 upx
$ go build -o server main.go && upx -9 server
# 结合编译选项
go build -ldflags="-s -w" -o server main.go && upx -9 server
upx 的参数 -9
指的是压缩率,1 代表最低压缩率,9 代表最高压缩率。
upx 压缩后的程序和压缩前的程序一样,无需解压仍然能够正常地运行,这种压缩方法称之为带壳压缩。
压缩包含两个部分:
- 在程序开头或其他合适的地方插入解压代码
- 将程序的其他部分压缩
执行时,也包含两个部分:
- 首先执行的是程序开头的插入的解压代码,将原来的程序在内存中解压出来
- 再执行解压后的程序。
也就是说,upx 在程序执行时,会有额外的解压动作,不过这个耗时几乎可以忽略。