如何让Go程序更快

本文为部分翻译、整理。原文为Go的开发者之一的Dave Cheney所做的 Five things that make go
fast

清晰赋值类型

例如，有一个绝对不会超过uint32的数值，就不要用int var gocon uint32 = 2015 这样gocon这个值只会占用4个字节
为啥呢？因为如下图，CPU的处理速度已经远超内存的总线速度了所以数值能用小的用小的，尽量让数值留在CPU
cache，而不是速度更慢的内存里

函数调用有overhead，为了内联，尽量消除编译器无法侦测的dead code

当函数调用时，始终是由overhead（额外开销）的，比如保存调用栈，CPU切出。
因此编译器会尝试进行内联，将小函数直接复制并编译。
举个栗子：

func Max(a,b int) int {
if a > b {
return a
}
return b
}
func DoubleMax(a, b) int {
return 2 * Max(a,b)
}

－m 查看内联状态 $go build -gcflags=-m main.go # utils src/utils/max.go:4: can inline Max src/utils/max.go:11: inlining call to Max
这样做的代价是可执行的二进制文件更大了，但由于内联，并不是函数调用，性能自然是更好了。但有些函数，是不能内联的，比如下面这个

func Test() bool {return False}
func Expensive() {
if test(){ //接下来的Expensive没办法内联
// Expensive....
}
}

改成下面这样就可以内联了

const TEST = False
func Expensive() {
if TEST{
// Expensive....
}
}

逃逸检查

首先，要理解一个概念，stack 和 heap
stack作用域是本地的（locals），在函数执行完之后会自动收回，CPU控制，效率高而heap则需要由程序来管理，效率低具体有篇文章讲这个：
Memory stack vs
heap
因此，就算有GC，也应该把不需要传出的参数尽量控制在函数内。例如下图的程序
因为numbers 只在
Sum中，编译器也会自动分配100个int空间在stack中，而不是heap中。正因为在stack 中，所以不需要GC参与，自动收回。
但这不意味着不能用指针引用，见第二个栗子：
尽管变量c是通过new函数生成的，但是因为在center外没有c的引用，所以c也会被存储在stack上。逃逸检查实例：

Goroutine

第四个，我觉得是提示吧： Goroutine是比进程、线程都小的执行单元 Goroutine中的会被调度器(scheduler)切出的操作：

chan 收发
go 语句调用函数
阻塞的syscall
gc

一图胜千言，下图表示了调度器是如何在goroutine之间切换的。
第五个算是对Go1.3以后的stack分配机制的总结，我就不翻译了，有兴趣的同学自己可以看看原文：）

总结

我想补充的是：逃逸对于channel也是成立的，因此，在channel之间，最好传递的也是对象，而不是引用。这个问题上我栽过一次了哈哈哈
之前我并不知道内联是啥，Golang、pypy这样的JIT、或者cpython真的是减轻了我的心智负担，当然，了解一下也是很不错的。
清晰的赋值个人感觉不是很必要，因为Go的int类型最大是2**31－1，性能调优的时候再认真地梳理其实也来得及

如何压缩Golang 编译出的可执行文件大小

发表评论

先给结论：可以减少到原来的29%

最近在写一个TLScat小工具
Github.com/mengzhuo/tlscat
源文件仅仅2KB不到，但是用 go build tlscat.go 编译出来的有4.6MB！

后来发现这个Golang的1.5才会解决的问题 Issue ＃6853 all: binaries too big and
growing 可是，我就不信这个邪，于是搜索到了go
build的一些用法 go build -ldflags "-s -w" ‘-s’ 相当于strip掉符号表，
但是以后就没办法在gdb里查看行号和文件了。 ‘-w’ flag to the linker to omit the debug information
告知连接器放弃所有debug信息这样一来就只有3MB了

然后发现在Mac平台下，还有upx这样神一般的存在。

UPX achieves an excellent compression ratio and offers very fast
decompression.

简而言之，upx就是对可执行文件进行压缩，然后可以已极快的速度解压并运行

可以用brew快速安装upx brew install upx upx 可执行文件

参加某开发比赛后记

发表评论

前些日子参加了某云的开发大赛，结果出来了～仅仅拿了一个三等奖，略桑心。
参赛过程具体见《[如何一下午写3000行？记某云的Golang API
SDK生产过程](/%e5%a6%82%e4%bd%95%e4%b8%80%e4%b8%8b%e5%8d%88%e5%86%993000%e8%a1%8c%ef%bc%9f%e8%ae%b0%e6%9f%90%e4%ba%91%e7%9a
%84golang-api-sdk%e7%94%9f%e4%ba%a7%e8%bf%87%e7%a8%8b)》

不过伤心之余，我理性一把，看了看前4的分别都是啥：特等奖是移动客户端的解决方案：mu
MU (Mobile UCloud) 是一个基于 UCloud API 的手机版管理工具……
成熟度已经和产品可以媲美了，也解决了在移动端大潮之下，官方对移动端支持几乎是空白的痛点，所以只需要签个协议就可以用的产品，拿奖不奇怪。
而三个一等奖里，有另一个产品： ESS_For_Ucloud
这货就相当于AWS里的ELB，同样是改改就能投入线上使用的产品。解决了……呃……官方有LB，但是需要人工调整这样"不云"的尴尬。第二个一等奖是：
Ucloud CLI命令行接口
回想我司的运维、SA们用来控制AWS的工具，不是web控制端，不是各种写好的SDK，而是AWS CLI，因为他们最熟悉的就是各种脚本。
这也正是比赛举办方所缺少的！虽然命令覆盖得并不是很完善，但也算是补上了个自动化运维的坑。最后一个一等奖是： Python
SDK
在我吐槽官方的SDK用了**params这样的动态语言特性时，聪明的人自然会想到，举办方自然希望修补官方的SDK也是比赛的侧重方向了嘛～

虽然，我粗浅地看下去，这个SDK也仅仅是修补了官方SDK调用时不严谨的尴尬，而且由于API这么多，自然覆盖得不全，但是也算抓住了举办方的心了。
公布之后在交流群里，不少人也吐槽自己UT覆盖率比得上面的都高，为啥只能拿二等甚至是三等。反过来想，真的算是程序员典型的思维了：自己做的程序、工具很"牛B"，但是为啥没有人用，甚至是不受欢迎。
都是因为： 没有抓住痛点！没有抓住痛点！！没有抓住痛点！！！ 所以，下次做东西的时候，得多问问自己：

需求是啥！？

如何一下午写3000行？记某云的Golang API SDK生产过程

发表评论

近日参加了某云的SDK编写比赛，官方给的样例是个Python版，请求直接用**params这样方法构造请求体

因为尼玛Golang是静态语言，我们严谨！没有可变参数！还没有默认值！！

所以我苦逼地写了一个多小时类似这样的代码：

func (c *Client) GetHostInstance(id string, option string, count int) {
// bla....
}

每个API一遍遍地重复，真是苦不堪言，啥时候是个头啊，人生苦短啊，早知道还用Python了…… 于是我去睡觉了，嗯梦中Rob
Pike托梦醒来，突然想到，几天前学习的Go
reflect库，可以反射出调用的type，这样我只要构造struct，然后遍历一下每一项，不就可以省了很多时间了么？于是，我开始构造各种struct
type GetHostInstance struct{ id string option string count int }
从json库中直接拉了些代码来遍历NumField，顿时感觉自己棒棒的！！但是，写了三个以后我突然发现API里有些参数是optional的！！！

幸好，Rob大大已经替我等想好了，那就是struct的TagField，于是我TM也构造了一个自己的解析器

type GetHostInstance struct{
id string `cloud:"optional"`
option string
count int }
// .....解析器部分代码
// .....获取tag tag := typ.Field(i).Tag.Get("cloud")

取出tag值之后，依靠检查struct这项是否为nil来确定是否传不传参数！
终于可变参数这么蛋疼的事情都让我解决了，紧接着，我又写了3个struct，累得不行了……年纪轻轻就体力不支了
但是我决定写完去，因为这么漂亮的解决方案不用来拿个马克杯做奖品怎么行？！
于是又写了3个API，我发现我就是在复制粘贴官方的API文档，于是我祭出我的复制粘帖大法＋Vim宏
顿时快了很多，变成5分钟一个API，我看了看文档里……TM的一共50多个接口！！ 5*50 ＝ 250 分钟＝ 4个多小时＝
我都可以拿来看《黑鹰坠落》+ 5集《GTA 5搞笑视频》了！！
于是我开始无聊地点着官方API文档，我突然发现，官方的API文档是用Sphinx写的，只是套了层自己的css而已 –>
因为我的请求体都只是struct，官方还把请求的类型都已经标注好了，这时耳边响起了：人生苦短，我用Python 的标语
我可以用python写个程序，将官方文档直接转成SDK 代码啊！！！于是，说干就干！！找了requests等库，人生顿时快乐了很多有没有～
壮观地生成，连注释都有(￣▽￣) 哈哈哈