初看一脸懵逼,看懂直接跪下!

why技术

共 3234字,需浏览 7分钟

 ·

2022-04-13 18:32

你好呀,我是歪歪。

我最近在 stackoverflow 上看到一段代码,怎么说呢。

就是初看一脸懵逼,看懂直接跪下!

f2962047a67e9e0c6b8237771a21463c.webp

我先带你看看 stackoverflow 上的这个问题是啥,然后引出这段代码:

https://stackoverflow.com/questions/15182496/why-does-this-code-using-random-strings-print-hello-world

问题特别简单,就一句话:

谁能给我解释一下:为什么这段代码使用随机字符串打印出了 hello world?

b84eeb57c98e8562177440cd2c4d1806.webp

代码也很简单,我把它拿出来给你跑一下:

public class MainTest {

    public static void main(String[] args) {
        System.out.println(randomString(-229985452) + " " + randomString(-147909649));
    }

    public static String randomString(int i) {
        Random ran = new Random(i);
        StringBuilder sb = new StringBuilder();
        while (true) {
            int k = ran.nextInt(27);
            if (k == 0)
                break;

            sb.append((char) ('`' + k));
        }
        return sb.toString();
    }
}

上面的代码你也可以直接粘贴到你的运行环境中跑一下,看看是不是也输出的 hello world:

9763331c688d4110a8b86747091c06ec.webp

我就问你:即使代码都给你了,第一眼看到 hello world 的时候你懵不懵逼?

c8093b656544f12b354e902285c54afa.webp

高赞回答

51df496609d6a3fe1b0e3a5d1f6b3f8e.webp

高赞回答也特别简单,就这么两句话。

我给你翻译一下,这个哥们说:

当我们调用 Random 的构造方法时,给定了一个“种子”(seed)参数。比如本例子中的:-229985452 或 -147909649。

那么 Random 将从指定的种子值开始生成随机数。

而每个用相同的种子构造的 Random 对象,都会按照产生相同的模式产生数字。

没看的太明白,对不对?

没关系,我给你上一段代码,你就能恍然大悟上面这一段说的是啥事:

public static void main(String[] args) {

    randomString(-229985452);
    System.out.println("------------");
    randomString(-229985452);

}

private static void randomString(int i) {
    Random ran = new Random(i);
    System.out.println(ran.nextInt());
    System.out.println(ran.nextInt());
    System.out.println(ran.nextInt());
    System.out.println(ran.nextInt());
    System.out.println(ran.nextInt());

}

这段代码,在我的机器上运行结果是这样的:

73bb4da37cbf6ebfbde289d02f212e91.webp

你拿过去跑,你的运行结果也一定是这样的。

这是为什么呢?

答案就在 Javadoc 上写着的:

6ee55c825cfdb8d3a108c07a874bacb5.webp

如果用相同的种子创建了两个 Random 的实例,并且对每个实例进行了相同的方法调用序列,那么它们将生成并返回相同的数字序列。

在上面的代码中两个 -229985452 就是相同的种子,而三次 nextInt() 调用,就是相同的调用序列。

所以,他们生成并返回相同的、看起来是随机的数字。

88b32d1c390506c3f93e63b124e8891f.webp

而我们正常在程序里面的用法应该是这样的:

522c953a3f97f2cc84458c597590eecb.webp

在 new Random() 的时候,不会去指定一个值。

我们都知道 Random 是一个伪随机算法,而构建的时候指定了 seed 参数的就是一个更加伪的伪随机算法了。

因为如果我可以推测出你的 seed 的话,或者你的 seed 泄露了,那么理论上我就可以推测出你随机数生成序列。

这个我已经在前面的代码中演示了。

再看看问题

在前面稍微解释了 “seed” 的关键之处之后,我们再回过头去品一品这个问题,大概就能看出点端倪了。

b37402e6b05cc6e9830b4442ca574536.webp

主要看这个循环里面的代码。

首先 nextInt(27) 就限定了,当前返回的数 k 一定是在 [0,27) 之间的一个数字。

如果返回 0,那么循环结束,如果不为零。则做一个类型转换。

接下来就是一个 char 类型的强制转换。

看到数字转 char 类型,就应该条件反射的想到 ascii 码:

c3cb281817327f317bc13206efa3c352.webp

从 ascii 码 表中,我们可以到 “96” 就是这里的这个符号:

b612bd108ebbcf582c5d1c6778a826a6.webp

所以,下面这个代码的范围就是 [96+1,96+26]:

'`' + k

也就是 [97,122],即对应 ascii 码的 a-z。

所以,我带你再把上面的演示代码拆解一下。

首先 new Random(-229985452).nextInt(27) 的前五个返回是这样的:

a0727a0c6016cc8aff5f357611d04942.webp

而 new Random(-147909649).nextInt(27) 的前五个返回是这样的:

21e7ef7e28bddd493bc491678ac80366.webp

所以,对照着 ascii 码表看,就能看出其对应的字母了:

8  + 96 = 104 --> h
5  + 96 = 101 --> e
12 + 96 = 108 --> l
12 + 96 = 108 --> l
15 + 96 = 111 --> o

23 + 96 = 119 --> w
15 + 96 = 111 --> o
18 + 96 = 114 --> r
12 + 96 = 108 --> l
4  + 96 = 100 --> d

现在,对于这一段谜一样的代码为什么输出了 “hello world” 的原因,心里是不是拨开云雾见青天,心里跟明镜儿似的。

看穿了,也就是一个小把戏而已。

84fa60d75e816c77369b0c54202f901e.webp

然后这个问题下面还有个评论,让我看到了另外一种打开方式:

ddcc5676bf10853142272d9d78d49809.webp

你能指定打印出 hello world,那么理论上我也能指定打出其他的单词。

比如这个老哥就打了一个短语:the quick browny fox jumps over a lazy dog.

如果从字面上直译过来,那么就是“敏捷的棕色狐狸跨过懒狗”,好像也是狗屁不通的样子。

但是,你知道的,我的 English 水平是比较 high 的,一眼就看出这个短语在这里肯定不简单。

于是查了一下:

8b35c3bcce63a9b8baa52c7111de90e9.webp

果然是有点故事的,属于 tricks in tricks。

be5ed0d53893607aa1dff6c0e8dfb618.webp

你看学沙雕技术的时候还顺便丰富了自己的英语技能,一举多得,这一会看完了还不得在文末给我点个赞、点个“在看”啥的?

看完这个老哥的 quick brown fox 示例之后,我又有一点新想法了。

既然它能把所有的字母都打出来,那我是不是也能把我想要的特定的短语也打出来呢?

比如 i am fine thank you and you 这样的东西。

而查找指定单词对应的 seed 这样的功能的代码,在这个问题的回答中,已经有“好事之人”帮我们写出来了。

我就直接粘过来,你也可以直接拿去就用:

public static long generateSeed(String goal, long start, long finish) {
    char[] input = goal.toCharArray();
    char[] pool = new char[input.length];
    label:
    for (long seed = start; seed < finish; seed++) {
        Random random = new Random(seed);

        for (int i = 0; i < input.length; i++)
            pool[i] = (char) (random.nextInt(27) + '`');

        if (random.nextInt(27) == 0) {
            for (int i = 0; i < input.length; i++) {
                if (input[i] != pool[i])
                    continue label;
            }
            return seed;
        }
    }
    throw new NoSuchElementException("Sorry :/");
}

那么我要找前面提到的短语,就很简单了:

377b53feffed93eddea04a4141129378.webp

而且运行的时候我明显感觉到,在搜索“thank”这个单词的时候,花了很多时间。

为什么?

我给你讲一个故事啊,只有一句话,你肯定听过:

只要时间足够漫长,猴子都能敲出一部《莎士比亚》。

我们这里 generateSeed 方法,就相当于这个猴子。而 thank 这个单词,就是《莎士比亚》。

在 generateSeed 方法里面,通过 26 个字母不断的排列组合,总是能排列出 “thank” 的,只是时间长短而已。

单词越长,需要的时间就越长。

比如我来个 congratulations,这么长的单词。你猜要跑多久?

本来这篇文章是周一发的,但是周一发的时候忘记标注原创了,所以我发了之后立刻删除了文章。

刚好这个单词我就可以多跑两天时间。

我看了一下,从 4 月 10 号 00:05 分,跑到 4 月12 号 22 点,70 个小时了都还没跑出来:

6116d772263b1f2e694279bb93243bcf.webp

控制台空空荡荡,我甚至怀疑是不是程序停了。于是还看了一下线程堆栈,确认了程序确实是在跑:

7a8b5b3eedc2e51884309bbd29e2f4db.webp

但是理论上来讲只要有足够长的时间,这个 seed 一定会被找到。

至此,你应该完全明白了为什么前面提到的那段代码,使用随机字符串的方式打印出了 hello world。

3409405a31a2080d0cfbb13f8f3c2c66.webp

源码

你以为我要带你读源码?

不是的,我主要带你吃瓜。

首先,看一下的 Random 无参构造函数:

3b48d76b68e3b1fd5b1dff8ff8b67bc3.webp

好家伙,原来也是套个了个“无参”的壳而已,实际上还是自己搞了一个 seed,然后调用了有参构造方法。

只是它构建的时候加入了“System.nanoTime()”这个变量,让 seed 看起来随机了一点而已。

等等,前面不是还有一个“seedUniquifier”方法吗?

这个方法是这样的:

8633ec913d09ad6f975872f0a6fb909b.webp

好家伙,看到第一眼的时候我头都大了,这里面有两个“魔法数”啊:

181783497276652981L
8682522807148012L

这玩意也看不懂啊?

遇事不决,stackoverflow。

一搜就能找到这个地方:

https://stackoverflow.com/questions/18092160/whats-with-181783497276652981-and-8682522807148012-in-random-java-7

a98f7899585cecb16071039e31d3bc39.webp

在这个问题里面,他说他对这两个数字也感到很懵逼,网上找了一圈,相关的资料非常的少。但是找到一个论文,里面提到了其中一个很接近的“魔数”:

4dda7eeb472a17265c008d83542e249d.webp

论文中提到的数是这样的:

3d7ba647962ebb0f0baf6b04ee2671b7.webp

看到没有?

这 Java 源码中的数字前面少了一个“1”呀,咋回事呢,该不会是拷贝的时候弄错了吧?

下面的一个高赞回答是这样的:

0da5d4ebd32eb6802998506103758fb5.webp

“看起来确实像是拷错了。”

有点意思,你要说这是写 Java 源码的老哥 copy 代码的时候手抖了,我就来劲了。

da36804a676b178c91e4742c66c8244c.webp

马上去 Java Bug 的页面上拿着那串数字搜一下,还真有意外收获:

https://bugs.openjdk.java.net/browse/JDK-8201634

3a2d3be0a30548f3c7ccf974ddc9cc1f.webp

在这个 bug 的描述里面,他让我注意到了源码的这个地方:

09d091168ad2bbb3d685287a0324b612.webp

原来这个地方的注释代表着一个论文呀,那么这个论文里面肯定就藏着这个数的来源。

等等,我怎么感觉这个论文的名字有点像眼熟啊?

前面 stackoverflow 中提到的这个链接,点进去就是一个论文地址:

daa71dc7b81dabbd51a859cbae508ecf.webp

你看看这个论文的名称和 Java 这里的注释是不是说的一回事呀:

c3d6e269515945acdf5414269974dc61.webp

那必须是一回事啊,只是一个小写一个大写而已。

所以,到这里实锤了,确实是最开始写 Java 这块源码的老哥 copy 数字的时候手抖了,少 copy 了一个 “1”。

而且我甚至都能想象到当时写这部分源码的时候,那个老哥把“1181783497276652981”这个数字粘过来,发现:哎,这前面怎么有两个 1 啊,整重复了,删除了吧。

至于把这个“1”删除了之后,会带来什么问题呢?

d5ecaf94210533c41eaf80a9d7cca4bb.webp

反正这里关联了一个问题,说的是:并发调用 new Random() 的随机性不够大。

这我就没去研究了,有兴趣可以去看看,我只负责带你吃瓜。

所以,基于这个“瓜”,官方修改了一次这个代码:

135b9b70318f8f629d90d6497d546487.webp

刚好我这里有 JDK 15 和 JDK 8 版本的代码,我去看了一下,还真是差了一个 “1” :

018c4901d3b8be900b0b7710295b455f.webp

而且关于随机数,现在一般很少用 Random 了吧。

直接就是上 ThreadLocalRandom 了,它不香吗?

什么,你说不会?

379e242e88d973b4ab2b2478d10dba40.webp

好了,那本文的技术部分就到这里啦。

下面这个环节叫做[荒腔走板],技术文章后面我偶尔会记录、分享点生活相关的事情,和技术毫无关系。我知道看起来很突兀,但是我喜欢,因为这是一个普通博主的生活气息。

你要不喜欢,退出之前记得文末点个“在看”哦。

荒腔走板

0158a65fa4ad5c3e7bec5fc94168610c.webp

上个周末,成都两天都是大太阳。

周六的时候我们一起去菜市场买菜,发现水果那一个片区里面都已经开始卖西瓜了。

看到切开的大西瓜那红红的瓜瓤,我想:应该是夏天已经来了。

我觉得成都其实一年只有两季,夏季和冬季。春季往往就那么十来天的时候,而秋季总是在几场大风之后就迅速的结束了。

我还是比较喜欢夏天的,至少不必把自己裹起来,可以更方便的活动筋骨。我在夏天跑步会比较频繁一点。

我更喜欢在夏天的晚上跑步,伴随着静谧、凉爽、虫鸣和心跳。但是夏天,在成都夜跑也是一件非常“危险”的事情。

毕竟路边烧烤摊,常常出现在街头拐角的地方。而烧烤摊常常不是一家家的出现,而是一片片的出现。那是一种我只要遇到了就很难抵挡的场面和味道。

这个时候,我脑海里面就出现了两个小人。

一个说:算了,遇都遇到了,说明缘分到了,跑步每天都可以跑,流动烧烤摊可不一定每天都有。

另外一个小人说:对呀对呀,吃一个至少吃一个烤苕皮吧,烤的时候记得让老板多烤一小会,让两面表皮稍微有一点点焦,但是整体又偏向松软。然后里面多加点折耳根和辣豇豆,最后撒上葱花和辣椒粉。咬了第一口,先是引爆自己的味蕾,然后一丝丝辣意直冲天灵盖,让你赶紧想吃第二口。哦,对了,顺便来一瓶勇闯天涯吧。

于是,我本来是出来跑步的,但是,烧烤摊上却多了一个顾客。

最后说一句

好了,看到了这里了, 转发、在看、点赞 随便安排一个吧,要是你都安排上我也不介意。写文章很累的,需要一点正反馈。

给各位读者朋友们磕一个了:74da4bbecbeba2ca0822b9981424000a.webp

推荐👍 :这个人,该火!

推荐👍 :一不小心节约了 591 台机器!

推荐👍 :我复现了Spring的漏洞,害怕!

推荐👍 :当Synchronized遇到这玩意儿,有个大坑,要注意!

推荐👍 :2021,我这一年。

··································

你好呀,我是歪歪。一个主要敲代码,经常怼文章,偶尔拍视频的成都人。

我没进过一线大厂,没创过业,也没写过书,更不是技术专家,所以也没有什么亮眼的title。

当年以超过二本线 13 分的“优异成绩顺利进入某二本院校计算机专业,误打误撞,进入了程序员的行列,开始了运气爆棚的程序员之路。

说起程序员之路还是有点意思,可以看看。点击蓝字,查看我的程序员之路

浏览 40
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报