代码生成器
Table of Contents
在本篇文章中,将要学习一下Go语言的代码生成的玩法
Go语言代码生成主要还是用来解决编程泛型的问题 泛型编程主要解决的问题是因为静态类型语言有类型,所以相关的算法或是对数据处理的程序会因为类型不同而需要复制一份,这样导致数据类型和算法功能耦合的问题 泛型编程可以解决这样的问题,就是说在写代码的时候,不用关心处理数据的类型,只需要关心相当处理逻辑 泛型编程是静态语言中非常非常重要的特征,如果没有泛型,很难做到多态,也很难完成抽象,会导致代码冗余量很大
现实中的类比
举个现实当中的例子,用螺丝刀来做比方 螺丝刀本来就是一个拧螺丝的动作,但是因为螺丝的类型太多,有平口的,有十字口的,有六角的,螺丝还有大小尺寸 结果是螺丝刀为了要适配各种千奇百怪的螺丝类型(样式和尺寸),就要做出各种各样的螺丝刀
而真正的抽象是螺丝刀不应该关心螺丝的类型,只要关注好自己的功能是否完备,并让自己可以适配于不同类型的螺丝
这就是所谓的泛型编程要解决的实际问题
Go的类型检查
因为Go语言目前并不支持真正的泛型,所以,只能用 interface{} 这样的类似于 void* 这种过度泛型来模拟,这就导致了在实际过程中就需要进行类型检查
Go语言的类型检查有两种技术,一种是 Type Assert ,一种是 Reflection
Type Assist
对某个 变量 进行 .(type) 的转型操作,其会返回两个值, variable , error ,第一个返回值是被转换好的类型,第二个是 如果不能转换类型,则会报错
比如下面的示例,有一个通用类型的容器,可以进行 Put(val)和 Get() 注意,其使用了 interface{}作泛型
//Container is a generic container, accepting anything. type Container []interface{} //Put adds an element to the container. func (c *Container) Put(elem interface{}) { *c = append(*c, elem) } //Get gets an element from the container. func (c *Container) Get() interface{} { elem := (*c)[0] *c = (*c)[1:] return elem }
在使用中,可以这样使用:
intContainer := &Container{} intContainer.Put(7) intContainer.Put(42)
但是,在把数据取出来时,因为类型是 interface{} ,所以,还要做一个转型,如果转型成功能才能进行后续操作下:
// assert that the actual type is int elem, ok := intContainer.Get().(int) if !ok { fmt.Println("Unable to read an int from intContainer") } fmt.Printf("assertExample: %d (%T)\n", elem, elem)
Reflection
对于反射,需要把上面的代码修改如下:
type Container struct { s reflect.Value } func NewContainer(t reflect.Type, size int) *Container { if size <= 0 { size = 64 } return &Container{ s: reflect.MakeSlice(reflect.SliceOf(t), 0, size), } } func (c *Container) Put(val interface{}) error { if reflect.ValueOf(val).Type() != c.s.Type().Elem() { return fmt.Errorf("Put: cannot put a %T into a slice of %s", val, c.s.Type().Elem()) } c.s = reflect.Append(c.s, reflect.ValueOf(val)) return nil } func (c *Container) Get(refval interface{}) error { if reflect.ValueOf(refval).Kind() != reflect.Ptr || reflect.ValueOf(refval).Elem().Type() != c.s.Type().Elem() { return fmt.Errorf("Get: needs *%s but got %T", c.s.Type().Elem(), refval) } reflect.ValueOf(refval).Elem().Set(c.s.Index(0)) c.s = c.s.Slice(1, c.s.Len()) return nil }
上面的代码并不难读:
- 在 NewContainer()会根据参数的类型初始化一个Slice
- 在 Put()时候,会检查 val 是否和Slice的类型一致
- 在 Get()时
- 需要用一个 入参 的方式,因为没有办法返回 reflect.Value 或是 interface{},不然还要做Type Assert
- 由于有类型检查,所以,必然会有检查不对的道理 ,因此,需要返回 error
使用上面这段代码的时候:
f1 := 3.1415926 f2 := 1.41421356237 c := NewMyContainer(reflect.TypeOf(f1), 16) if err := c.Put(f1); err != nil { panic(err) } if err := c.Put(f2); err != nil { panic(err) } g := 0.0 if err := c.Get(&g); err != nil { panic(err) } fmt.Printf("%v (%T)\n", g, g) //3.1415926 (float64) fmt.Println(c.s.Index(0)) //1.4142135623
它山之石
对于泛型编程最牛的语言 C++ 来说,这类的问题都是使用 Template 来解决的
//用<class T>来描述泛型 template <class T> T GetMax (T a, T b) { T result; result = (a>b)? a : b; return (result); } int i=5, j=6, k; //生成int类型的函数 k=GetMax<int>(i,j); long l=10, m=5, n; //生成long类型的函数 n=GetMax<long>(l,m);
C++的编译器会在编译时分析代码,根据不同的变量类型来自动化的生成相关类型的函数或类。C++叫模板的具体化
这个技术是编译时的问题,所以,不需要在运行时进行任何的运行的类型识别,程序也会变得比较的干净 那么,是否可以在Go中使用C++的这种技术呢?答案是肯定的,只是Go的编译器不帮你干,你需要自己动手
Go Generator
要玩 Go的代码生成,需要三件事:
- 一个 函数模板 ,其中 设置好相应的占位符
- 一个 脚本 ,用于按 规则来替换文本 并 生成新的代码
- 一行 注释代码
函数模板
把我们之前的示例改成模板。取名为 container.tmp.go 放在 ./template/下:
package PACKAGE_NAME type GENERIC_NAMEContainer struct { s []GENERIC_TYPE } func NewGENERIC_NAMEContainer() *GENERIC_NAMEContainer { return &GENERIC_NAMEContainer{s: []GENERIC_TYPE{}} } func (c *GENERIC_NAMEContainer) Put(val GENERIC_TYPE) { c.s = append(c.s, val) } func (c *GENERIC_NAMEContainer) Get() GENERIC_TYPE { r := c.s[0] c.s = c.s[1:] return r }
可以看到函数模板中有如下的占位符:
- PACKAGE_NAME: 包名
- GENERIC_NAME: 名字
- GENERIC_TYPE: 实际的类型
其它的代码都是一样的
函数生成脚本
然后写一个叫 gen.sh 的生成脚本,如下所示:
#!/bin/bash set -e SRC_FILE=${1} PACKAGE=${2} TYPE=${3} DES=${4} #uppcase the first char PREFIX="$(tr '[:lower:]' '[:upper:]' <<< ${TYPE:0:1})${TYPE:1}" DES_FILE=$(echo ${TYPE}| tr '[:upper:]' '[:lower:]')_${DES}.go sed 's/PACKAGE_NAME/'"${PACKAGE}"'/g' ${SRC_FILE} | \ sed 's/GENERIC_TYPE/'"${TYPE}"'/g' | \ sed 's/GENERIC_NAME/'"${PREFIX}"'/g' > ${DES_FILE}
需要4个参数:
- 模板源文件
- 包名
- 实际需要具体化的类型
- 用于构造目标文件名的后缀
其会用 sed 命令去替换我们的上面的函数模板,并生成到目标文件中
生成代码
接下来,需要在代码中打一个 特殊的注释 :
//go:generate ./gen.sh ./template/container.tmp.go gen uint32 container func generateUint32Example() { var u uint32 = 42 c := NewUint32Container() c.Put(u) v := c.Get() fmt.Printf("generateExample: %d (%T)\n", v, v) } //go:generate ./gen.sh ./template/container.tmp.go gen string container func generateStringExample() { var s string = "Hello" c := NewStringContainer() c.Put(s) v := c.Get() fmt.Printf("generateExample: %s (%T)\n", v, v) }
在工程目录中直接执行 go generate -x 命令,就会生成如下两份代码:
一份文件名为 uint32_container.go :
package gen type Uint32Container struct { s []uint32 } func NewUint32Container() *Uint32Container { return &Uint32Container{s: []uint32{}} } func (c *Uint32Container) Put(val uint32) { c.s = append(c.s, val) } func (c *Uint32Container) Get() uint32 { r := c.s[0] c.s = c.s[1:] return r }
另一份的文件名为 string_container.go
package gen type StringContainer struct { s []string } func NewStringContainer() *StringContainer { return &StringContainer{s: []string{}} } func (c *StringContainer) Put(val string) { c.s = append(c.s, val) } func (c *StringContainer) Get() string { r := c.s[0] c.s = c.s[1:] return r }
这两份代码可以让以后编译通过,所付出的代价就是需要多执行一步 go generate 命令
新版Filter
有了这样的技术,就不必在代码里用那些晦涩难懂的反射来做运行时的类型检查了 可以写下很干净的代码,让编译器在编译时检查类型
下面是一个Fitler的模板文件 filter.tmp.go:
package PACKAGE_NAME type GENERIC_NAMEList []GENERIC_TYPE type GENERIC_NAMEToBool func(*GENERIC_TYPE) bool func (al GENERIC_NAMEList) Filter(f GENERIC_NAMEToBool) GENERIC_NAMEList { var ret GENERIC_NAMEList for _, a := range al { if f(&a) { ret = append(ret, a) } } return ret }
在需要使用这个的地方,加上相关的 go generate 的注释 :
type Employee struct { Name string Age int Vacation int Salary int } //go:generate ./gen.sh ./template/filter.tmp.go gen Employee filter func filterEmployeeExample() { var list = EmployeeList{ {"Hao", 44, 0, 8000}, {"Bob", 34, 10, 5000}, {"Alice", 23, 5, 9000}, {"Jack", 26, 0, 4000}, {"Tom", 48, 9, 7500}, } var filter EmployeeList filter = list.Filter(func(e *Employee) bool { return e.Age > 40 }) fmt.Println("----- Employee.Age > 40 ------") for _, e := range filter { fmt.Println(e) } filter = list.Filter(func(e *Employee) bool { return e.Salary <= 5000 }) fmt.Println("----- Employee.Salary <= 5000 ------") for _, e := range filter { fmt.Println(e) } }