惊呆了！这个 Go 语言的 Bug 价值十亿美元-技术圈

原文：Billion-Dollar Mistake in Go ?
地址：https://hackernoon.com/billion-dollar-mistake-in-go-ll1s3tkc
作者：Harri Lainio（@lainio[1]）
翻译：Jayce Chant（博客：jaycechant.info，公众号 ID：jayceio）

十亿美元（billion dollar）的错误 / bug 貌似是美国的一个梗，大概的意思是，对于那些市值上几千亿的大企业，如果一个错误能够导致市值下跌个百分之零点几，就已经是十亿左右了。
在计算机领域，最著名的 BDM 大概是图灵奖得主 Tony Hoare 说他在 1965 年发明的 null 引用。
但我不确定这是不是最早的出处，毕竟在商业领域这样的说法也很常见。

以下为译文：

以下示例代码来自 Go 的标准库文档^[2]：

data := make([]byte, 100)
count, err := file.Read(data)
if err != nil {
    log.Fatal(err)
}
fmt.Printf("read %d bytes: %q\n", count, data[:count])

代码看起来没什么问题。出自标准库官方文档的代码，肯定不会错，对吧。

在阅读介绍 Read 函数的 io.Reader 文档^[3] 之前，我们先花几秒钟来弄清楚这里面有什么问题。

例子里的 if 语句（至少）应该这样写：

if err != nil && err != io.EOF {

你也许在想，我是不是在自欺欺人：我们不是应该查看 File.Read 函数的文档^[4] 吗？那个才是正确的文档吧？是的，但那不应该是唯一正确的文档。

译者注：读到这里的朋友可能会云里雾里，又未必愿意 / 方便（特别是公众号不能外链）看完文档再回来。我简单介绍一下。
在 io.Reader 接口的文档里，当 Read 遇到文件结束时，io.EOF 可能跟着非 0 的 n （读取的有效字节数）一起返回，也可能在下次调用跟 n = 0 一起返回。（这部分文档很长，有 1300 多个单词，还介绍了 Read 方法其它可能的行为，但多数是建议而不是强制的口吻。）
File.Read 的文档则只有一句话，非常明确地指出遇到文件结尾时，会返回 0, io.EOF 。（换言之，io.EOF 不会跟有效字节一起返回。）

如果我们不能真的用接口隐藏实现细节，那接口有什么用处？一个接口应该规定（set）它的语义，而不是像 File.Read 那样规定它的实现者。当接口的实现者是 File 以外的其他东西，但仍是一个 io.Reader 时，上面的代码会发生什么？当它把数据和 io.EOF 一起返回时，它退出得太早了，但这对所有的 io.Reader 实现者都是允许的。

接口（Interface） vs 实现者（Implementer）

在 Go 里面，你不需要显式标记接口的实现者。这是一个强大的特性。但这是否意味着我们总是应该根据静态类型来使用接口语义呢？例如，下面的 Copy 函数是否应该使用 io.Reader 的语义？

func Copy(dst Writer, src Reader) (written int64, err error) {
    src.Read() // 现在 read 的语义是来自 io.Reader 吗?
    ...
}

那这个版本是不是应该只使用 os.File 的语义呢？(注意，这些只是虚构的例子)

func Copy(dst os.File, src os.File) (written int64, err error) {
    src.Read() // 那现在 read 的语义是不是来自 os.File 的 Read 函数呢 ?
    ...
}

实践中认为，总是应该使用接口语义，而不是绑定到具体的实现——这就是有名的松耦合^[5]。

io.Reader 的问题

这个接口有以下问题：

如果不学习 io.Reader 的文档，你就不能安全地使用任何 Read 函数的实现。
如果不仔细研究 io.Reader 的文档，你就无法实现 Read 函数。
由于缺少对错误（error）的分类（distinction），接口不够直观、完整和符合习惯。

正因为 io.Reader 是一个接口，前面提到的问题才多了起来。这给 io.Reader 的每个实现者和 Read 函数的每个调用者之间带来了跨包依赖。

标准库本身就有很多其它 `io.Reader`^[6] 的调用者误用（misuse）该接口的例子。

根据这个问题单（issue）^[7]，标准库——尤其是里面的测试——都坚持使用 if err != nil 这个写法，这就阻止了 Read 实现中的优化。

例如，当检测到 io.EOF 时，如果（连同剩余的数据）立即返回 io.EOF ，就会让一部分调用者无法正确运行。原因是显而易见的。reader 接口文档允许两种不同类型的实现：

Read 在成功读取 n > 0 个字节后，如果遇到错误或文件结束的情形，它会返回读取的字节数。它可能会在同一个调用中返回（非 nil）错误，也可能会在后续调用中返回错误（同时 n = 0）。

接口应该是直观的、并且是通过编程语言本身正式地定义的，使得你无法实现或者误用它们（cannot implement or misuse them）。开发者不应该需要先阅读文档才能进行必要的错误传递。

译者注：这里的 'cannot implement' 感觉意思不对，不知道原作者是不是想表达错误实现的意思，却只在 use 上加了 mis，忘了 implement。个人猜测本意是 'cannot implement or use them in a wrong way' ，不能错误地实现或者使用它们。但这只是我个人的猜测，写在这里，译文还是忠实于原文。

允许接口函数有多个（本例中是两个）不同的显式行为是有问题的。接口的思想，是隐藏实现细节，实现松散耦合。

最明显的问题是，io.Reader 接口既不直观，也不符合 Go 典型的错误处理惯例。它还打乱了程序推导中正常和错误分离的控制路径。这个接口使用错误传递机制来处理一些实际上不是错误的东西：

EOF 是 Read 没有更多输入时返回的错误。函数应该只返回 EOF 来表示输入的正常（grateful）结束。如果 EOF 在结构化数据流中意外发生，相应的错误应该是 ErrUnexpectedEOF 或其他能给出更多细节的错误。

作为可辨识联合（Discriminated Unions^[8]）的错误

io.Reader 接口和 io.EOF 指出了 Go 目前的错误处理中所缺少的东西，那就是 错误的分类（the error distinction）。例如，Swift 和 Rust 不允许部分失败。函数调用要么成功，要么失败。这就是 Go 的错误返回值的问题之一。编译器无法提供任何支持。众所周知，这同样也是 C 语言的非标准错误返回的问题——当你有一个重叠的错误返回通道时就会这样。

Herb Shutter（译者注：C++ 程序设计专家，曾担任 ISO C++ 的秘书和会议召集人，原文有笔误，应为 Sutter）特意在他的 C++ 提案《零开销的确定性异常：抛出值（Zero-overhead deterministic exceptions: Throwing values）^[9]》中提到：

『正常』与『错误』（控制流）是一个非常基础的语义区分，而且可能在任何编程语言中都是最重要的区分，尽管这一点总是被低估。

解决办法

Go 当前 io.Reader 接口存在问题，是因为违反了语义的区分。

增加语义上的区别

首先，我们通过声明一个新的接口函数，停止使用返回错误来处理不是错误的东西。

Read(b []byte) (n int, left bool, err error)

只允许明显的行为

其次，为了避免混淆以及阻止明确的错误，我们引导使用下面的助手包装器（helper wrapper）来处理这两种允许的 EOF 行为。包装器只提供了一个显式行为来处理数据的结束。因为文档中说，必须允许在没有任何错误（包括 EOF）的情况下返回零字节（不鼓励在无错误的情况下返回零字节），所以我们不能将读取的零字节作为 EOF 的标志。当然，包装器也保持了错误的区分。

type Reader struct {
    r   io.Reader
    eof bool
}

func (mr *MyReader) Read(b []byte) (n int, left bool, err error) {
    if mr.eof {
        return 0, !mr.eof, nil
    }
    n, err = mr.r.Read(b)
    mr.eof = err == io.EOF
    left = !mr.eof
    if mr.eof {
        err = nil
        left = true
    }
    return
}

我们做了一个错误区分规则，错误和成功的结果是排他的。我们也对返回值 left 进行了区分。当我们已经读取了所有的数据，我们会将其设置为 false，使得函数变得更加易用，这在下面的 for 循环中可以看到：只有在 left 设为 true ，即数据可用时，才需要处理传入的数据。

for n, left, err := src.Read(dst); err == nil && left; n, left, err = src.Read(dst) {
    fmt.Printf("read: %d, data left: %v, err: %v\n", n, left, err)
}

正如示例代码所示，它允许将正常路径（happy path）和错误控制流分开，这使得程序推导变得更加容易。我们在这里展示的解决方案并不完美，因为 Go 的多个返回值之间并无区别。

在我们这里，它们都应该是这样的。无论如何，我们已经了解到，每个新人（包括刚接触 Go 的人）都可以在没有文档或示例代码的情况下使用我们新的 Read 函数。这就是一个很好的例子，说明 正常路径和错误路径的语义区分是多么重要。

结论

我们可以说 io.EOF 是一个错误（mistake）吗？我想说是的。这里有一个错误（errors）应该与预期的返回（expected returns）区分开的完美的理由。我们应该始终构建鼓励正确路径（praise happy path）和防止错误^[10] 的算法。

Go 的错误处理实践还缺少语言特性来帮助语义的区分。幸运的是，我们大多数人已经在清楚区分的控制流中处理错误。

原译者文章

参考资料

[1]

@lainio: https://hackernoon.com/u/lainio

[2]

标准库文档: https://golang.org/pkg/os/

[3]

文档: https://golang.org/pkg/io/#Reader

[4]

文档: https://golang.org/pkg/os/#File.Read

[5]

松耦合: https://zh.wikipedia.org/wiki/%E6%9D%BE%E8%80%A6%E5%90%88

[6]

io.Reader: https://golang.org/pkg/io/#Reader

[7]

问题单（issue）: https://github.com/golang/go/issues/21852

[8]

Discriminated Unions: https://en.wikipedia.org/wiki/Disjoint_sets

[9]

零开销的确定性异常：抛出值（Zero-overhead deterministic exceptions: Throwing values）: http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2018/p0709r0.pdf

[10]

防止错误: https://github.com/97-things/97-things-every-programmer-should-know/blob/master/en/thing_66/README.md

推荐阅读

理解真实世界中 Go 的并发 BUG

福利

我为大家整理了一份从入门到进阶的Go学习资料礼包，包含学习建议：入门看什么，进阶看什么。关注公众号「polarisxu」，回复 ebook 获取；还可以回复「进群」，和数万 Gopher 交流学习。

惊呆了！这个 Go 语言的 Bug 价值十亿美元