AI识图能有多野?

爱泡研究所

共 3703字,需浏览 8分钟

 · 2021-10-23


这个世界,网友们总有办法在科技产品里找到欢乐。

比如,很久以来他们就发现百度识图、搜狗识图等工具能搜出惊人结果。

看看这两个“大发现”感受一下。

百度搜图认为PS5游戏机是四方形钻石彩色马桶




百度识图认为某部日漫是赵本山小品








是不是感觉匪夷所思?

一时间,你找不到两者的联系;几小时后,又觉得它们好像也有些关联(PS5的配色确实有点儿神似马桶)。

最后,你会心一笑,明白AI早已看透了一切。

这时候,识图工具调皮的一面清晰展现在世人面前。


01.

识图工具一般情况下是能够准确运行的。

当你往百度、搜狗的搜索栏里上传一张图片,它们迅速解开你的疑惑,告诉你这是什么花,什么树。

为此人们对它大加赞赏。

后来把它们用到动物识别上时,人们才明白过来,复制粘贴并不那么容易。

有网友用百度识图扫描了大熊猫的图片,结果软件把大熊猫识别成哈士奇。


其实问题很严重。

试想一下,大熊猫体制内的待遇被取消,它无法好吃懒做了,那还愿意当国宝吗?

这事搁谁谁也不乐意。

开心的唯有哈士奇,它将接受更多的万千宠爱。

狗狗占便宜也不是一次两次了。

某相机的AI照相把猫看作了狗。


换个角度也是如此。换个姿势也是如此。


换个品牌的手机也是如此。

视觉世界的复杂性由此清晰可见,一张图片中通常有百万个像素点,对于AI来说就存在大量会被像素修改而影响的特征,人类看不到,但是AI可能被干扰。

科学研究的结论也往往是积累经验,慢慢克服。

可这也带来一个问题。

既然猫狗之间的识别区分会成为难题,那么为什么更多的是把猫当狗,而不是把狗当猫。

要知道,后者的情况少之又少。


甚至比把猫咪识别成大熊猫的情况还少。


一言以蔽之,在AI的视角下,狗狗成了最大赢家,猫咪成了最大输家。

当然,识图工具也在制造动物界的其他矛盾。


在物种之间张冠李戴,算是一种地地道道的“body shame”了。

其实这还不是羞耻的。

有人在浴室里发现了一只虫子,爬行速度缓慢,可惜不知道它的学名。


于是,他用起了识图工具。

没想到,搜狗识图把虫子图识别成色情图片,并遮挡了它的肉体。


可想而知,这种生硬打码的方式让虫子特别难堪。

化用本山大叔在小品里的台词就是:

“丢不丢人啊,丢不丢虫啊,同行怎么看它?蚂蚱怎么看它?螳螂怎么看?蛐蛐怎么看?今后在文艺界怎么混?”

与之同等级伤害的,估计要算把人当做狗了。



02.

从植物识别到动物识别,AI迈了一步,但这步并不轻松。

而从动物识别再跨越至人物识别,挑战更多,这就意味着AI的表现更狂野。

如果说,AI把漂亮姐姐识别成朱一龙,把美丽女士识别成马云,算有些夸张了。


那么,把小女孩悲伤表情识别成杨颖,真的算非常离谱了。


我们很难找到其中的共同点的。

就像洋葱和塑料假花两个事物,你我又能从中看透什么呢?

而且这也不是单次的意外,有人用网页版刷出来的效果是这样,有人用百度App扫出来的效果也是如此。

那么我们就有理由怀疑,她们本质上都让人感到欲哭无泪,所以AI将她们捆绑在一起。

同样,把马保国识别成李小龙,算是调侃手法了。


同样,还有将赞多识别成小栗旬的。


还有将女演员识别成男演员任嘉伦的。


没有统一的标准,没有基本的规律,奇葩的识别效果呈现出来的一刻,人们无不捧腹大笑。

只要心放得够宽,便能迎接一大波的梦幻联动场面。

表情包、懒羊羊与韩国明星的三元联动。


嫪毐与西方绘画艺术的二元联动。


没有人的想象力能在这样的场面上把持得住。

试图去解开其中的逻辑关联,不啻去破解数学难题。

何苦呢?

而且,这还没完。

把狗狗当做杨幂,又是怎么回事?


或许是表情包的应用更容易让明星们增加粉丝数量。

所以如何营造更广泛的传播机制成了明星们关注的重要话题。

毕竟人的力量是有限的,智能机器的力量却是无穷尽的,于是,连语文课本封面被AI看成是蔡徐坤了。


到这个时候,之前很多关于智能识图的科学研究显得不太可靠了。

它们可以解读出猫狗识别的常见问题,却没有给这些问题提供答案上的启发。

我们只能寄希望于人为解读了,哪怕是过度解读。

比如,因为参加过《奔跑吧,兄弟》,因为对曼联足球队情有独钟,因为参加了很多运动公益活动,所以大数据下,“鹿晗”可能与“跑”标签存在关联。

但是直接将塑胶跑道认作是鹿晗本人,怎么看都有背后的推手在。


一个是物,一个是人,相隔了不少的物理界限。

或许只能说互联网帮助突破了想象的边界。

互联网深入千家万户后,粉丝期待自家明星在互联网上格外出圈,永不掉落出热榜。

他们频繁操作,为明星刷出流量来,因此那些图在AI看来有了一个标签,大量堆积的话,图就成为了明星本人。

哲学上来说,不过是明星的再次物化罢了。
 
如果是这样的逻辑的话,我们完全可以相信,在未来更强盛的流量明星机制下:

一张白纸可能暗示了某位一尘不染形象的明星;
一颗牛肉丸可能会被认作是某位扎过丸子头发型的明星;
一些圆圆圈圈的画可能被识别成会打球踢球的明星。

想想都有些刺激。

那么真的会这样吗?


03.

我试了试。

语文课文封面就是语文课文封面,马保国就是马保国,狗狗表情包就是表情包。


并没有大规模出现上述诡异场面。

即使测测新图也是如此。

从电视剧的截图,从比赛的抓拍里,AI都能将人物识别出来。


这时候,科技作为人身体的延长的功能就淋漓尽致地展现了出来。

因为人的身体是有局限性的,比如人眼辨认有时候不那么精准。

像雷军这样的老板,甚至能难倒一些新闻媒体工作者,让他们以为是周鸿祎。

但在AI的眼里,那就是分分钟的事。

而且,我能用多种方式识别出来。


估计是现在的技术越来越精确的原因。

上文的一些图能那么奇葩和搞笑,很大程度上是因为几年前的技术并不怎么完善,随着时间的沉淀,它们才越来越先进。

当然在我使用的过程中同样出现了一些小插曲。

比如人物识别里出现了土猪品种推荐。


比如“压力不大的从业者”下面的面相分析是“工作表现奋斗努力,吃苦耐劳,能成大事”。


虽然里面不乏幽默和讽刺,但总归在相关性上比之前好太多了。

对于普通人来说,实在不想遇到那么悬疑和烧脑的问题了。

另一方面,也说明科技应用到生活上的水平越来越高了。


04.

识图的作用有时候就是不容小觑的。

2019年6月,贵州“孤儿院儿童疑被性侵”的消息在网络中流传,说幼儿园孤儿院被重金贿赂,发生性侵幼儿的事情。

由于非常对互联网热度的胃口,导致许多人没怎么了解事情真相之前就进行了转发。

但并不是所有网友们听风就是雨,他们使用AI识图工具进行鉴别,几秒钟就找到了相似图。

原来热点新闻里的图是从网上盗用的。

果不其然,经调查,这就是谣言。


在这个过程中,令人感到欣喜的是,由于AI识图的便利性,不少普通网友随手就识破了谣言。

这一招也被很多人用来打击抄袭。

他们用AI识图保护原创。

这一招也被很多人用来识别对象出轨与否。

好让自己远离人渣。

这一招也被很多人用来抵御杀猪盘的侵害。

小红书等网站上已经形成了防诈骗教程,帮助更多人保护自己。


所有这些维护自己利益的方式都很快捷、高效。

虽说科技是中性的,但当你遭到伤害的时候,它们无形之中帮你保留住一丝丝的温暖。

也许这算是科技的一种风度。


05.

2018年,刘慈欣获得克拉克想象力贡献社会奖,演讲中,他说:
 
“周围的世界变得越来越像科幻小说了,这种进程还在飞快地加速,未来像盛夏的大雨,在我们还不及撑开伞时就扑面而来。”

其实想想,如果未来真像大雨一样扑面而来,会是一件很爽的事情。

往短了想一想,像上面那些很夸张的AI搜索结果会避免,毕竟最严重的搜图事故,往往都是由AI缺乏经验造成的。

往长了想一想,等各种AI技术完全成熟以后,可能未来生活形式与知识获取方式会发生质的改变,要知道现在应用设计为了各种现实限制而做了很多妥协。

那么,到时候会不会街上皆是AR穿戴设备,你随便戴上一个就可以开启识物的模式?

再进一步,会不会你手指点点某物,眼前就能出现它的各种信息?

无论如何,都将完全改变我们现在的知识信息获取格局。

你我推开秘门,目睹的就是新世界。

十年前,用计算机来区分猫和狗被认为几乎不可能。
而如今,视觉识别的准确率已超99%。


再进一步看来。

十年前,基本还没有手机互联网。
三十年前,互联网是个稀缺的东西;
一百年前,电灯没法为千家万户所高频使用;
一百五十年前,还没有汽车,马车往往是当时最便捷的交通工具了。


科技,作为第一生产力的科技正在改变这一切,将使许多人的人生更加便捷和智能。

至少自动驾驶的刹车刹得更可靠一些,至少癌症检测更精准一些。

更远的未来,曾经科幻片里的场景也能实现,或者,打个响指,飞来一块机器,就可以载人出行,对人进行体检,为人准备三餐,等等。

无论如何,未来在变得越来越好,更多的可能在向我们热情地招手。

而我们所能做的,开开心心,快快乐乐,多活几年,最好活个上百岁,以便看看七八十年后,人类文明可以进展到什么地步。

要真正发展AI技术,半导体芯片的研发可少不了,所以半导体基金也是个新的投资方向(Apple友情提醒:投资有风险 入市需谨慎)。

点击阅读原文,或者长按下方二维码了解



↓戳这里,立即上车
浏览 29
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报