1.为什么需要内存对齐

CPU 访问内存并不是逐个字节访问,而是以字长(word size)为单位访问。如 32 位的 CPU ,字长为 4 字节,那么 CPU 访存的单位是 4 字节。

这么设计的目的,是减少 CPU 访问内存的次数,加大 CPU 访问内存的吞吐量。比如同样读取 8 个字节的数据,一次读取 4 个字节那么只需要读取 2 次。

CPU 始终以字长访问内存,如果不进行内存对齐,可能会增加 CPU 访存次数。

内存对齐前变量 a、b 各占据 3 个字节,CPU 读取 b 变量的值需要两次访存,第一次访存得到前一个字节,第二次得到后两个字节。内存对齐后 a、b 各占 4 个字节,CPU 读取 b 变量的值只需要一次访存。

从这个例子可以看到,内存对齐对实现变量的原子性操作也是有好处的。每次内存访问是原子的,如果变量的大小不超过字长,那么内存对齐后,对该变量的访问就是原子的,这个特性在并发场景下至关重要。

简言之:合理的内存对齐可以提高内存读写性能,并且便于实现变量操作的原子性。

2.Go 内存对齐规则

编译器一般为了减少 CPU 访存指令周期,提高内存访问效率,会对变量进行内存对齐。Go 作为一门追求高性能的后台编程语言,当然也不例外。

Go Language Specification 中 Size and alignment guarantees 描述了内存对齐的规则。

1.For a variable x of any type: unsafe.Alignof(x) is at least 1. 2.For a variable x of struct type: unsafe.Alignof(x) is the largest of all the values unsafe.Alignof(x.f) for each field f of x, but at least 1. 3.For a variable x of array type: unsafe.Alignof(x) is the same as the alignment of a variable of the array's element type.

  • 对于任意类型的变量 x ,unsafe.Alignof(x) 至少为 1。
  • 对于结构体类型的变量 x,计算 x 每一个字段 f 的 unsafe.Alignof(x.f),unsafe.Alignof(x) 等于其中的最大值。
  • 对于数组类型的变量 x,unsafe.Alignof(x) 等于构成数组的元素类型的对齐系数。

其中函数 unsafe.Alignof 用于获取变量的对齐系数。对齐系数决定了字段的偏移和变量的大小,两者必须是对齐系数的整数倍。

3.合理的 struct 布局

因为内存对齐的存在,合理的 struct 布局可以减少内存占用,提高程序性能。

type demo1 struct {
    a int8
    b int16
    c int32
}

type demo2 struct {
    a int8
    c int32
    b int16
}

func main() {
    fmt.Println(unsafe.Sizeof(demo1{})) // 8
    fmt.Println(unsafe.Sizeof(demo2{})) // 12
}

可以看到,同样的字段,因排列顺序不同,会导致不一样的结构体大小。

每个字段按照自身的对齐系数来确定在内存中的偏移量,一个字段因偏移而浪费的大小也不同。

接下来逐个分析,首先是 demo1: a 是第一个字段,默认是已经对齐的,从第 0 个位置开始占据 1 字节。 b 是第二个字段,对齐系数为 2,因此,必须空出 1 个字节,偏移量才是 2 的倍数,从第 2 个位置开始占据 2 字节。 c 是第三个字段,对齐倍数为 4,此时,内存已经是对齐的,从第 4 个位置开始占据 4 字节即可。

因此 demo1 的内存占用为 8 字节。

对于 demo2: a 是第一个字段,默认是已经对齐的,从第 0 个位置开始占据 1 字节。 c 是第二个字段,对齐倍数为 4,因此,必须空出 3 个字节,偏移量才是 4 的倍数,从第 4 个位置开始占据 4 字节。 b 是第三个字段,对齐倍数为 2,从第 8 个位置开始占据 2 字节。

demo2 的对齐系数由 c 的对齐系数决定,也是 4,因此,demo2 的内存占用为 12 字节。

因此,在对内存特别敏感的结构体的设计上,我们可以通过调整字段的顺序,将字段宽度从小到大由上到下排列,来减少内存的占用。

4.空结构与空数组对内存对齐的影响

空结构与空数组在 Go 中比较特殊。没有任何字段的空 struct{} 和没有任何元素的 array 占据的内存空间大小为 0。

因为这一点,空 struct{} 或空 array 作为其他 struct 的字段时,一般不需要内存对齐。但是有一种情况除外:即当 struct{} 或空 array 作为结构体最后一个字段时,需要内存对齐。因为如果有指针指向该字段,返回的地址将在结构体之外,如果此指针一直存活不释放对应的内存,就会有内存泄露(该内存不因结构体释放而释放)。

type demo3 struct {
    a struct{}
    b int32
}
type demo4 struct {
    b int32
    a struct{}
}

func main() {
    fmt.Println(unsafe.Sizeof(demo3{})) // 4
    fmt.Println(unsafe.Sizeof(demo4{})) // 8
}

可以看到,demo3{} 的大小为 4 字节,与字段 b 占据空间一致,而 demo4{} 的大小为 8 字节,即额外填充了 4 字节的空间。

powered by Gitbook该文章修订时间: 2024-08-04 07:27:05

results matching ""

    No results matching ""