Go Package Notes

Go 常用包的功能,及注意点

官方

context

为多携程调用提供三种功能:传值、超时、取消。

  • 多个 context 对象可形成树形关联,当父 context 取消后,子 context 也会随之取消;子 context 取消后,父 context 不受影响
  • context 是线程安全的

container/heap

提供(最小)堆相关函数和接口,可以延伸实现优先级队列功能。需要自己实现接口,以满足一个可排序的容器,然后结合函数使用。

  • 最小元素的下标是 0,可以用来做peak处理
type Interface interface {
    sort.Interface
    Push(x interface{}) // add x as element Len()
    Pop() interface{}   // remove and return element Len() - 1.
}
  • 注意 对 Heap 的操作一定要通过heap.XXX函数执行

  • Heap 提供了remove函数,需要数组下标作为参数,可以通过堆查找实现O(logn)删除指定元素

  • 对于[]int类型的 heap,可以直接内嵌sort.IntSlice类型自动实现sort.Interface

container/list

提供链表数据结构

// 可以利用 Remove + Front/Back 实现 Pop 功能
l.Remove(l.Front()).(int)

WithCancel

cancel 函数可以调用多次,不会发生 panic,只有第一次调用起作用

encoding/json

对 struct 进行 marshal 和 unmarshal 操作,实现原理利用了反射,所以性能较差,在高并发下可用其他库替代。

  • struct 内嵌 interface 只能 marshal 无法 unmarshal,由于字符串无法反向推导类型
  • 对 interface 可以进行 marshal,会根据 interface 中保存的实际结构体类型进行 marshal

  • unmarshal 时,可以传入几种可识别的类型,比如 struct、slice、map,根据不同的类型结果不同。
    • struct 将按照其中的导出成员变量进行解析
    • slice 将被解析为多个字符串,每个字符串是一个 json 对象
    • map 将被解析为map[string]interface{}结构,其中interface{}可能是一个 map
    • 也可以直接传入多维 map 结构,如map[string]map[string]string,可以自动解析

在 unmarshal 时,传入的参数必须是对应类型的指针,并且保证对象已构造。但是 slice 或 map 的 make 并不是必须的,只要对象自动创建了,不需要 make 初始化。

var out map[string]interface{}
err = json.Unmarshal(str, &out)
if err != nil {
	log.Panicln(err)
}
  • unmarshal 时,如果传入了interface(无论是interface{}还是特定类型的interface), 如果 interface 已经指向了有效对象,则会 unarshal 成功;如果指向 nil,则会 panic。

  • json [1, "2"][]interface{} 类型解析时会把1解析为float64类型,底层思路是尽量把信息保留下来避免丢失。

  • 有时 struct 中成员类型是 int64,一个 uint64 的数值可能报错 “json: cannot unmarshal number xxxxxx into Go struct field”

    • Go 中没有 uint64,所以会报错
    • 这种情况下,可以把类型改为 float64,一方面可以接受数值不会报错;另一方面这个数字往往是溢出后的情况,不需要太精确。
struct Test {
  ignored int64 `json:"-"`  // 忽略该字段
}
  • 可以通过重写MarshalJSON/UnmarshalJSON方法实现自定义的 json 序列化和反序列化
func (o TestType) MarshalJSON() ([]byte, error) {
  return []byte(fmt.Sprintf("%d", o)), nil
}

func (o *TestType) UnmarshalJSON(data []byte) error {
  var i int64
  err := json.Unmarshal(data, &i)
  if err != nil {
    return err
  }
  *o = TestType(i)
  return nil
}

errors

import "github.com/pkg/errors"  // 这个包继承了内置的`errors`,提供了更好的功能

err1 := errors.New("this is an error")  // 创建 error 对象
err2 := errors.WithMessage(err1, "upper level error") // wrap with message

fmt.Println(err)  // output all error message
// upper level error: this is an error

fmt.Printf("%+v", err) // output call all message and stacks
/*
upper level error: this is an error
main.main
    /usr/three/main.go:11
main.main
    /usr/three/main.go:15
*/

errorgroup

errorgroup 综合了 waitGroup 和 context 的能力,可以同时等待多个协程、返回错误、协程 cancel

  • 优点:
    • 结合了sync.WaitGroup,直接group.Go(...)启动携程,无需wg.Add(1)
    • 如果绑定了 context,任意函数返回 error 会触发 cancel;如果不绑定 context 可以当成普通的 WaitGroup 使用
    • group.Wait()可以自动收集第一个 error
func testErrorGroup() {
	rand.Seed(time.Now().Unix())
	const threadNum = 5
	ctx, cancel := context.WithCancel(context.Background())
	group, errCtx := errgroup.WithContext(ctx)

	for i := 0; i < threadNum; i++ {
		index := i // 避免闭包中引用同一个 i

		group.Go(func() error {
			if index < threadNum-1 {
				for j := 0; j < 10; j++ {
					log.Printf("%v is running %v", index, j)
					time.Sleep(time.Microsecond*time.Duration(rand.Int()%1000) + time.Second)

					select {
					case <-errCtx.Done(): // 检测到已 cancel 后退出
						log.Printf("%v return with error: %v", index, errCtx.Err())
						return fmt.Errorf("%v error: %v", index, errCtx.Err())
					default:
					}
				}
				log.Printf("%v end", index)
			} else {
				time.Sleep(time.Microsecond*time.Duration(rand.Int()%1000) + time.Second*3)
				// 返回 error 时,由于绑定了 context,会自动触发 cancel
				return fmt.Errorf("%v cancel error", index)
			}
			return nil
		})
	}

	err := group.Wait()
	if err == nil {
		log.Println("all done!")
	} else {
		log.Printf("found error: %v", err)  // 输出:"found error: 4 cancel error"
	}
}

flag

用于获取命令行参数,同时可以设置默认值

可以获得各种类型的参数,无法获得无参数标记的参数


func main() {
// 一定要先执行 parse
flag.Parse()

// 获取参数
var port int
flag.IntVar(&port, "port", 8080, "server port")
}

fmt

  • %+v 格式符表示递归打印数据结构的字段名和值
  • %#v 递归打印字段名和字段类型和值
  • %[2]v%[2]v%[1]v 可以通过这种形式选定后边的第几个参数,避免重复传入相同参数,下标从 1 开始

    • 这种 template 还有个好处:如果后面的参数多于要求的,生成的字符串不会报错;而用”%v”的模板,多余的参数会已报错字符串的形式加入结果
  • %02d 打印整形时前面补0,保留2

Scan

用于从字符串读取数据到变量,支持的类型包括基本类型,[]bytestringstructslicemap

// 从 stdin 读入多个数据
a, b := 0, 0
fmt.Scan(&a, &b)

// 从 string 读入多个数据
var s string
var i int
Sscanf(" 1234567 ", "%5s%d", &s, &i)

重写 String 函数

  • 可以编写自定义 String 函数,用于 fmt 打印
type MyStruct struct {
    Field1 string
    Field2 int
}

func (s MyStruct) String() string {
    // 在这里编写自定义的字符串表示逻辑
    return fmt.Sprintf("Field1: %s, Field2: %d", s.Field1, s.Field2)
}

http

http 请求相关

req, err := http.NewRequest(http.MethodPost, "url", strings.NewReader("body"))
if err != nil {
  return err
}
req.URL.RawQuery = url.Values{"key":"value"}.Encode()
req.Header.Set("Content-Type", "charset=UTF-8")
req.SetBasicAuth("username", "password")

resp, err := http.DefaultClient.Do(req)
if err != nil {
  return err
}
defer resp.Body.Close()

body, err := io.ReadAll(resp.Body)

常见问题

  • response 返回了 \x1f\x8b\x08... 乱码
    • 原因:服务端返回的响应头 Content-Encoding: gzip

io

func MultiWriter(writers ...Writer) Writer 将多个 Writer 融合,每次写入会同时写入这些 Writer

io.NopCloser(r io.Reader) io.ReadCloser 自动判别输入的 reader 是否有对应的 writer 接口,如果没有则封装执行Close()时什么也不做

io/ioutil

提供简易的 IO 操作

ioutil.WriteFile 简易写入文件

ioutil.ReadFile 简易读取文件

ioutil.ReadDir 读出文件夹中的子文件列表,列表按照名称排序,其中有可能包含文件夹元素

ioutil.Discard 用于抛弃读出的数据

// 有时收到 http response 后不关心 body 内容,可以直接丢弃
defer res.Body.Close()
_, _ = io.Copy(ioutil.Discard, res.Body)

bufio

可以对 IO 进行方便的遍历

    // 初始化
		scanner := bufio.NewScanner(file)
		for scanner.Scan() {
      // 遍历每一行文本
			line := scanner.Text()
			log.Println(line)
		}

    // 遍历结束后,判断是否由于 error 导致了结束
		if err := scanner.Err(); err != nil {
			return err
		}

log

log 相关

log.Panic() 输出 panic 级别日志后,开启 panic

log.Fatal() 输出 fatal 级别日志后,执行 os.Exit()

os

os.MkdirAll(path, os.ModePerm) 创建一系列文件夹

os.Getenv("HOME") 获取环境变量,返回字符串

func Getwd() (dir string, err error) 获取当前当前目录的绝对路径

os.signal

可以设置监听哪些系统信号

signals := make(chan os.Signal, 1)
signal.Notify(signals, os.Kill, syscall.SIGQUIT, syscall.SIGTERM, syscall.SIGINT)
select {
	case sig := <-signals:
		fmt.Println("get sys signal", sig)
		// end code
}

path

提供路径相关操作

path.Base(string) 取得文件全名·

path.Join([]string...) 将 path 路径用’/’连接起来

  • 注意,本函数只适合在 linux path 模式下,windows 下也只能增加’/’,某些情况会发生不兼容;另外对 url 使用时,也只适合 url host 后面的 path 部分

net/url

func Parse(rawurl string) (*URL, error) Parse 函数可以从字符串解析出 url.URL 的对象指针,url.URL 包含了 URL 的各参数

pool

提供对象池接口,用于缓存对象,避免频繁申请、释放内存造成的性能问题。

  • 一定要创建 Pool 对象时执行New如果池中没有对象,会调用指定的 New 方法生成一个;如果没有指定 New 方法,那么返回 nil
  • 池不可以指定大小,大小受限于 GC 的临界值
  • 对象的最大缓存周期是 GC 周期,当 GC 调用时没有引用的对象会被清理掉
    • pool 包在 init 中注册一个 poolCleanup 函数用于清除所 pool 里的缓存对象,每次 GC 之前会被调用
  • Get 方法返回时是返回池中任意一个对象,没有顺序;

math

func Sqrt(x float64) float64

code snippet

func RoundFloat(val float64, precision uint) float64 {
	ratio := math.Pow(10, float64(precision))
	return math.Round(val*ratio) / ratio
}

math/rand

用于生成随机数,注意和”crypto/rand”包名相同

  • 使用前要先做一个种子,否则其实不随机。 rand.Seed(time.Now().Unix())

func Float32() float32/func Float64() float64 return a pseudo-random number in [0.0,1.0)

func Intn(n int) int/func Int31n(n int32) int32 return a non-negative pseudo-random number in [0,n)

reflect

反射相关

func DeepEqual(x, y interface{}) bool 利用反射对两个对象深度比较,比较 interface 类型时,必须类型和值都相同才能 true。

  • 一些特殊的比较点:
    • Func 类型如果都为 nil 则 equal,否则 not equal。即使是相同函数都 not equal
    • “empty slice” != “nil slice”
    • slice 不比较 cap
    • 如果对象内存在环状依赖,算法会自动识别出这种依赖,在第二次遇到重复对象时会自动认为 equal

regexp

正则表达式类

// 匹配找到分组,分组下标按照可能找到的位置排列,第 0 位置是整个匹配的字符串
re := regexp.MustCompile(`pattern`)
var reRet []string = re.FindStringSubmatch(`string`)
matches := regex.FindAllStringSubmatch(`string`, -1)

runtime

运行时调用相关

runtime.NumCPU() 返回当前硬件的 CPU 核数

runtime.GOMAXPROCS(int) 设置当前可同时运行的最大线程数(GPM 中 P 的数量)

var numCPU = runtime.GOMAXPROCS(0) 返回用户指定的最大 P 数量。如果没有设置,默认值为 CPU 核数

runtime.Caller(skip int) (pc uintptr, file string, line int, ok bool) 返回调用栈帧信息,skip >= 0。如果是 0,表示打印调用Caller的这行代码信息。

runtime/trace

to generate traces for the Go execution tracer The execution trace captures a wide range of execution events such as goroutine creation/blocking/unblocking, syscall enter/exit/block, GC-related events, changes of heap size, processor start/stop, etc. A precise nanosecond-precision timestamp and a stack trace is captured for most events. The generated trace can be interpreted using go tool trace.

  • func Start(w io.Writer) error 开始将 trace 信息写入文件

sort

提供排序相关接口

func Sort(data Interface)	// 快排
func Stable(data Interface)	// 稳定排序
type Interface interface {
    // Len is the number of elements in the collection.
    Len() int
    // Less reports whether the element with
    // index i should sort before the element with index j.
    Less(i, j int) bool
    // Swap swaps the elements with indexes i and j.
    Swap(i, j int)
}
  • SearchInts(a []int, x int) int 在有序数组中,用二分查找法,找到目标第一次出现的下标。如果没有找到,则返回将插入的位置下标,即下一个元素第一次出现的下标。

sort.Ints

func Ints(x []int) 对[]int 进行排序

sort.Reverse

func Reverse(data Interface) Interface 适配 sort.Interface.Less 为反向处理(<>)

type IntSlice []int[]int附加sort.Interface,以便利用各种 Sort 中的函数

s := []int{5, 2, 6, 3, 1, 4} // unsorted
sort.Sort(sort.Reverse(sort.IntSlice(s)))
fmt.Println(s)	// output: 6 5 4 3 2 1

sort.Search

func Search(n int, f func(int) bool) int LowerBound 算法,在有序数组中查找[0,n)范围内满足f的最小下标,如果没有满足条件的,则返回 n

  • 利用闭包实现f
  • 如果二分查找范围是[x, x+n),则可以Search(n,...),然后在f函数进入后index+x修正范围

sort.Slice

func Slice(x interface{}, less func(i, j int) bool) 利用闭包对任意类型的 Slice 排序。该函数底层利用反射实现

sort.Reverse

将接口的 less 函数结果取反,以便反转最终排序结果达到反向排序(从大到小)的目的

func Reverse(data Interface) Interface

s := []int{5, 2, 6, 3, 1, 4} // unsorted
sort.Sort(sort.Reverse(sort.IntSlice(s)))

sync.Mutex

互斥锁

  • Go 中的 Mutex 是不可重入的,不像 Java 中的
  • Mutex 是一个 Struct 对象,并且其中的私有成员变量有重要作用,所以 Mutex 对象使用中不能复制拷贝;sync.WaitGroup 也是相同的原理。

  • 为了避免对 Mutex 拷贝,go vet会检查 sync.Mutex 对象的拷贝并报错,其原理是利用noCopy内嵌对象来进行检测。 其他 struct 如果不想被拷贝,可以利用内嵌type DoNotCopy [0]sync.Mutex(GRpc 实现), 由于数组 len 为 0 不占空间(不要放在最后一个元素,否则占 8 字节)

实现设计点

  • 基本的原子操作和判断是利用atomic.CompareAndSwapInt32
  • 锁定后唤醒,是利用sync.runtime_SemacquireMutex
  • 锁有几种状态:未加锁、已锁定、饥饿状态
  • “饥饿状态”激发条件:队首元素等待时间超过 1ms。激发后,新的 lock 请求会被自动排到队尾,不进行自旋等待。
  • “饥饿状态”使得 Lock 排队中的 goroutine 得以抢到锁,以避免”尾部延迟现象”
  • 新抢锁的 goroutine,如果满足下面四个条件,会尝试自旋优先抢锁
    1. mutex 已经被 locked 了,处于正常模式下;
    2. 当前 goroutine 为了获取该锁进入自旋的次数小于四次;
    3. 当前机器 CPU 核数大于 1;
    4. 当前机器上至少存在一个正在运行的处理器 P 并且处理的运行队列为空;

sync.WaitGroup

可以为多个 goroutine 设置统一起跑时机或统计统一结束时机。

sync.Map

实现了线程安全的 Map

strings

字符串操作函数

func ToLower(s string) string

  • strings.EqualFold(a, b string) bool 忽略大小写下,是否相等

strings.Split(str, seperator string) []string 将字符串按照分隔符切割为多个子字符串组成的切片

strings.Builder 用于字符串拼接builder.WriteString("test"),在大量字符串拼接时性能远高于+,只在最后builder.String()时申请一次内存。

func NewReader(s string) *Reader 将 string 转为 io.Reader

time

提供时间日期相关操作

  • 如果想在某个时间基础上减掉一段时间,可以用 Add 负数的方式。
str := "2019-12-28 10:01:02.123456789"
timeLayout := "2006-01-02 15:04:05.000000000"
t := time.Parse(timeLayout, str)

将字符串按照模版字符串的格式解析为 time.Time 对象

  • 其中模板字符串比较特殊,必须是指定的常量或"2006-01-02 15:04:05.000000000"这个值的变式
  • 时间的秒单位后,用09表示一个位置,精度可以到纳秒(9 个 0)。

  • 由于对象内部构造细节,无法直接比较,time 的比较要用专用函数after/before,相等也要用func (t Time) Equal(u Time) bool

  • func (t Time) Equal(u Time) bool 比较两个 Time 对象是否相等,会考虑到时区问题。注意用t1 == t2的方式比较可能存在问题。

ticker

  • 使用 ticker 时,可能由于 ticker 设置时间较长同时没有及时关闭而导致的 ticker 泄漏,可以用defer ticker.Stop()解决。
  • 注意 Stop ticker 后,ticker.C 并不会关闭,只是不再有值返回了。
// ticker 结合 for select 的用法
func testFunc(){
  ticker := time.NewTicker(time.Second)
  defer ticker.Stop()
  doneCh := make(chan struct{})
  defer close(doneCh)
  go func() {
  waitLoop:
    for {
      select {
      case <-doneCh:
        // 注意,这里直接用 break 的话,由于被 select 吸收,所以永远无法退出循环
        break waitLoop
      case <-ticker.C:
        // do something
        // 注意,如果有多个 case,并且想保持循环,要用 continue 继续循环,不小心 return error 就会跳出循环
      }
    }
  }()
  // some code
}
  • 对于等待时间较短的,可以利用time.After实现简易等待,但是如果频率高、时间长,可能会造成 ticker 泄漏
select {
  case <-time.After(time.Second):
    // do something
  case ...:
}

unicode

func IsDigit(r rune) bool func IsLetter(r rune) bool

unsafe

底层指针相关的操作,可以调用 C 语言库函数,就是所谓的 CGo 机制

  • CGo 只能调用 C 的接口,无法调用 C++。由于 C++标准太多太复杂,无法支持。可以通过 C 封装 C++的方法实现间接调用。

unsafe.Sizeof(x) 传入任意变量,返回该变量对应类型所占字节数

第三方

“go.uber.org/atomic”

把原有的 atomic 函数封装成方便使用的类,如atomic.Int64

“github.com/sourcegraph/conc”

便于并发的处理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
import (
  "github.com/sourcegraph/conc"
  "github.com/sourcegraph/conc/pool"
  "github.com/sourcegraph/conc/panics"
)


func main() {
  for i := 0; i < 10; i++ {
		wg.Go(func() {
      //...
		})
	}
  // 所有 goroutine 结束才返回
  // 如果某一 groutine 发生 panic 则会被捕获到
	pan := wg.WaitAndRecover()

  ctx := context.Background()
	p := pool.NewWithResults[string](). // 创建可返回结果的携程池
		WithMaxGoroutines(2). // when no more worker, new will be blocked
		WithContext(ctx)      // when first error happend, all will be cancel
  for i := 0; i < 10; i++ {
    p.Go(func(c context.Context) (ret string, err error) {  // 执行
      // ...
    })
  }

	// if panic happend in one of the goroutine, p.Wait() will cause panic
	pc.Try(func() { rets, err = p.Wait() })
	// pc.Repanic()	// re propagate panic
	p1 := pc.Recovered() // catch panic
	fmt.Println(rets, err, p1)
}

github.com/jinzhu/copier

利用反射嵌套拷贝结构体间的同名成员

  • 大类型必须一致(比如 int32 和 int64 大类型一致),否则不能自动做类型变更

github.com/go-co-op/gocron

定时任务

1
2
3
4
5

func main() {
  	scheduler := gocron.NewScheduler(time.UTC)
    s.CronWithSeconds("*/1 * * * * *").Do(task) // every second
}

github.com/jmoiron/jsonq

方便的对 json/yaml 深度嵌套结构进行查询,通常先将 json/yaml 解析为map[string]interface{}类型,然后再用 jsonq 查询

import (
	"strings"
	"encoding/json"
	"github.com/jmoiron/jsonq"
)

data := map[string]interface{}{}
dec := json.NewDecoder(strings.NewReader(jsonstring))
dec.Decode(&data)
jq := jsonq.NewQuery(data)

// data["subobj"]["subarray"][1] -> 2
jq.Int("subobj", "subarray", "1")

github.com/wI2L/jsondiff

比较两个 json 字符串,返回差异。可以忽略多余的空格等。

patch, err := jsondiff.CompareJSON(str1, str2)
if err != nil {
}
log.Pringln(patch)

github.com/go-redsync/redsync/v4

redis 分布式锁

github.com/avast/retry-go

方便的进行 retry

import "github.com/avast/retry-go"

func target() (string, error) {
  return "", fmt.Errorf("error")
}

func main() {
  var ret string
  var err error
  retry.Do(func() error {
    ret, err = target()
  }, retry.Attempts(3))

  if err != nil {}
  fmt.Println(ret)
}

github.com/google/uuid

提供 UUID 生成功能

log.Println(uuid.New().String())

github.com/davecgh/go-spew/spew

递归打印复杂嵌套对象

spew.Printf("myVar1: %v -- myVar2: %+v", myVar1, myVar2)

https://github.com/Velocidex/ordereddict

模仿 Python 的 collections.OrderedDict 类,以插入顺序为输出顺序,可以 map 避免乱序的问题。

https://github.com/kisielk/godepgraph

可以打印 Go 的包依赖关系,依赖 Graphviz 组件可以进一步生成图。

godepgraph ./pkg/api

golang.org/x/text

实现了各种文本编码、字符集相关操作

github.com/jmoiron/sqlx

实现了各种方便的 SQL 查询

// 对指定的 id 数组进行查询
ids := []int{1,2,3}
query, args, err := sqlx.In("select * from xxx where id in (?);", ids)
if err != nil {
  return err
}
query = bm.tx.Rebind(query)

if err := bm.tx.SelectContext(ctx, &res, query, args...); err != nil {
  return err
}

gopkg.in/yaml.v3

yaml 操作,用法和 json 包类似。v3 版本修复map[interface{}]interface{}的类型问题。

if err := yaml.Unmarshal([]byte(str), &config); err != nil {
}

snippets

func MysqlRealEscapeString(value string) string {
    var sb strings.Builder
    for i := 0; i < len(value); i++ {
        c := value[i]
        switch c {
        case '\\', 0, '\n', '\r', '\'', '"':
            sb.WriteByte('\\')
            sb.WriteByte(c)
        case '\032':
            sb.WriteByte('\\')
            sb.WriteByte('Z')
        default:
            sb.WriteByte(c)
        }
    }
    return sb.String()
}