跟 Dave Cheney 大神重学 Go Slice:有新收获

共 3838字,需浏览 8分钟

 ·

2020-12-22 13:57

点击上方蓝色“Go语言中文网”关注,每天一起学 Go

数组 Arrays

每次讨论到 Go 的切片问题,都会从这个变量是不是切片开始,换句话说,就是 Go 的序列类型,在 Go 中,数组有两种关联属性。

  1. 数组拥有固定的大小;[5]int 即表明是一个有 5 个 int 的数组,又与 [3]int 相区分开。
  2. 他们是值类型。思考下面这个例子。
package main
import "fmt"
func main() {
 var a [5]int
 b := a
 b[2] = 7
 fmt.Println(a, b) // prints [0 0 0 0 0] [0 0 7 0 0]
}

声明语句 b:=a 声明一个新变量 b,一个 [5]int 的数据类型,并把 a 的内容拷贝到 b 中,更改 b 中的值并不会对 a 中内容造成影响,因为 ab 是独立的。

作者注:这并不是数组的特殊属性,在 Go 中,每次分配其实都是副本值传递

切片 slices

Go 的切片类型与数组类型有两个不同的地方:

  1. 切片其实没有固定长度,一个切片的长度没有被声明为其类型的一部分,而是被保留在切片结构本身中并且可以通过内置函数 len 来重置他。
  2. 用一个切片赋值给另一个切片并不会创建前一个切片的内容副本,因为切片类型没有直接拥有它的内容,而是拥有一个指针,而这个指针指向切片下方的数组,数组内的元素才是切片的内容。

作者注:这有时也被成为后台数组(backing arrays)

由于第二个特性,两个数组可以同时分享一个后台数组,思考以下例子:

例 1:对切片再切片

package main

import "fmt"

func main() {
 var a = []int{1,2,3,4,5}
 b := a[2:]
 b[0] = 0
 fmt.Println(a, b) // prints [1 2 0 4 5] [0 4 5]
}

译者注:a 也是个切片,而不是数组,只要 [] 内没有数字,就是切片,在本例中,a 是数组{1,2,3,4,5}的一个切片

在这个例子中,ab 共同分享同一个后台数组,尽管 b 开始的偏移量和和长度都不同于 a,所以底层数组的更改会用同时影响到 ab

例 2:传切片变量给函数

package main

import "fmt"

func negate(s []int) {
 for i := range s {
  s[i] = -s[i]
 }
}

func main() {
 var a = []int{12345}
 negate(a)
 fmt.Println(a) // prints [-1 -2 -3 -4 -5]
}

在例 2 中,a 被传值给 negate 函数作为形式参数 s,函数遍历 s 中的元素,将他们转为相反数,尽管 negate 函数没有返回任何值或者用任何方式去在 main 中访问 a,但是 a 中的内容还是被 negate 所修改了。大多程序员程序员对 Go 中的切片与数组有一个直观的了解,应为这样的概念在其他语言中也有,例如:

Python 重写例 1

Python 2.7.10 (default, Feb  7 201700:08:15)
[GCC 4.2.1 Compatible Apple LLVM 8.0.0 (clang-800.0.34)] on darwin
Type "help""copyright""credits" or "license" for more information.
>>> a = [1,2,3,4,5]
>>> b = a
>>> b[2] = 0
>>> a
[12045]

Ruby

irb(main):001:0> a = [1,2,3,4,5]
=> [12345]
irb(main):002:0> b = a
=> [12345]
irb(main):003:0> b[2] = 0
=> 0
irb(main):004:0> a
=> [12045]

slice Header

想要理解 slice 是如何做到本身是一个类,并且又是一个指针的话,就得理解  slice 的底层结构[1]

slicet Header 看起来就像这样:

Slice Header.png
package runtime

type slicece struct {
 ptr   unsafe.Pointer
 len   int
 cap   int
}

它不像`map` 和 `chan` 类型[2],它们是引用类型,而切片是值类型,在赋值或者作为参数传递给函数的时候会复制。

为了说明这些,程序员可以直观的将 square() 的形参理解为 mainv 的副本。

package main

import "fmt"

func square(v int) {
 v = v * v
}

func main() {
 v := 3
 square(v)
 fmt.Println(v) // prints 3, not 9
}

square 的操作并不会对原本的 v 有任何影响,形参可以理解为所传值的单独拷贝。

package main

import "fmt"

func double(s []int) {
 s = append(s, s...)
}

func main() {
 s := []int{123}
 double(s)
 fmt.Println(s, len(s)) // prints [1 2 3] 3
}

Go 的 slice 变量稍微有点不一样的特性就是他是作为值传递的,不仅仅是一个指针,90% 的时间当我们在 Go 中声明一个结构体的时候,你都会传递一个结构体指针。slice 的值传递很不常见,我能想到的另一个值传递的结构体为 time.time

作者注:当结构体实现了某个接口的时候,那么传递指针的概率这接近 100%

正是这种异常的,将 slice 作为值传递,而不是指针传递,这引起了 Go 程序员的混乱思考,但是只要记住:当我们赋值,截取,传递或者返回一个切片的时候,你只是在创建一个 slice Header 结构体,这个结构体有着三个字段:指向后台数组的指针,当前长度 len,容量 cap

总结

写一个用切片作为栈的例子。

package main

import "fmt"

func f(s []string, level int) {
 if level > 5 {
     return
 }
 s = append(s, fmt.Sprint(level))
 f(s, level+1)
 fmt.Println("level:", level, "slicece:", s)
}

func main() {
 f(nil0)
}

main 开始,我们传递一个空值给 f 作为 level 0,在 f 内部,我们添加当前的 levels,一旦 level 大于 5,f 就会执行 return 语句 ,打印 s 的副本。

level: 5 slicece: [0 1 2 3 4 5]
level: 4 slicece: [0 1 2 3 4]
level: 3 slicece: [0 1 2 3]
level: 2 slicece: [0 1 2]
level: 1 slicece: [0 1]
level: 0 slicece: [0]

via: https://dave.cheney.net/2018/07/12/slices-from-the-ground-up

作者:Dave Cheney[3]译者:Jun10ng[4]校对:unknwon[5]

本文由 GCTT[6] 原创编译,Go 中文网[7] 荣誉推出

参考资料

[1]

slice 的底层结构: https://golang.org/pkg/reflect/#sliceHeader

[2]

mapchan 类型: https://dave.cheney.net/2017/04/30/if-a-map-isnt-a-reference-variable-what-is-it

[3]

Dave Cheney: https://dave.cheney.net/about

[4]

Jun10ng: https://github.com/Jun10ng

[5]

unknwon: https://github.com/unknwon

[6]

GCTT: https://github.com/studygolang/GCTT

[7]

Go 中文网: https://studygolang.com/



推荐阅读


福利

我为大家整理了一份从入门到进阶的Go学习资料礼包,包含学习建议:入门看什么,进阶看什么。关注公众号 「polarisxu」,回复 ebook 获取;还可以回复「进群」,和数万 Gopher 交流学习。

浏览 39
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报