AI识别技术, 在怎样改变全球流媒体们?
这是Han的第72篇原创文章
话说,最近这高质量网综也太多了吧,都看不过来!
我这时间,全耗在各种职场、侦探、语言、演技类节目里了。
那今天,咱就来说说,这些流媒体平台吧。
我一直觉得啊,咱互联网企业的“落地”能力,那是杠杠的。
同样类型的App,对比国外App,国内大厂总有各种新奇的功能,真引领世界。
周末,我看《奇葩说》的时候,就发现爱奇艺在推广一个新玩意儿—— “扫一扫”。
视频旁边,会有个扫面按钮。开始我还不知道,这是干嘛的。
点击了之后才发现,原来是对内容扫描啊,进行人脸识别。然后,会告诉你视频里的人都是谁,还有相关百科。
哇,完美解决观众常见需求—— “这人谁啊?”。
仔细想想,技术上,还真挺难的。
要知道,这可不是机场里面那种 1:1 人脸识别,你可以正对着摄像头,让系统认出来。
你看,诞总和虫仔,视频里根本没看镜头,机器只能根据一部分侧脸做出判断。
在我看看来,类似“扫一扫”的创新功能,改变的可不仅仅是优化用户体验。
通过这小小的功能,我看到的是全球流媒体平台们暗潮涌动的技术整体实力的竞争,以及在“识别”这个动作下,人、场、物,正在技术赋予的想象力中串联在一起。
来,我们先“认识”一下
这背后的原理其实都类似,一共分两步。 第一步,就是识别并理解内容。 把剪辑好的全片直接倒入,系统首先就会开始对内容进行识别。 比如,进行复杂环境下的人脸识别,认出演员是谁,还能知道谁是主角,谁是群演。 除了人,还会对景色、物体识别,贴上各种标签,比如“公园里”,“家里近景”等等。 另外,还会对台词和配乐分析,识别各个片段的情感,是惊悚还是温情,一目了然。 这一过程想要做到详细,是很耗费时间的,因为要跟其他来源的数据对比。比如IBM的Watson,就需要24小时来完成。
上面这两步里,第一步的“识别”是基础,第二步的“生成”则是应用。 当然,第一步最为重要也是必须,而且同一部影片,系统理解一次之后,结果可以重复利用,赋能更多应用。 第一步的“识别”还真是“基础武功”。正因如此重要,各大流媒体巨头都在重点投入研发。 国内方面,老大哥爱奇艺在研究识别这件事上下了大功夫。比如爱奇艺计算机视觉的研究成果多次被包含ICCV在内的学术会议收录,多次在挑战赛获奖。 爱奇艺还曾直接联合了国内外顶级视觉和多媒体会议,如PRCV2018和ACMMM,首次发起“多模态视频人物识别挑战赛”,还公布了全球最大的明星视频数据集(iQIYI-VID),联手产学研,取得突破。
![c855fd6bc9c16bd1469cdb7ec03ce14b.webp](https://filescdn.proginn.com/af9916e74eac4167eefb22cb04413726/c855fd6bc9c16bd1469cdb7ec03ce14b.webp)
“认识”之后,事儿了就好办了
剪辑方面,目前已经商用的,更多的,是一个“助手”角色。比如,拍真人秀的时候,需要FollowPD时刻记录,还要后期各种人工打标签,剪辑的时候超级费劲。 有了AI的加持,系统可以快速扫描内容,然后按照明星角色分类,还可以识别各类场景,甚至人物的语言和情绪,给各个片段都打上有用的标签。 比如,在《中国新说唱》后期制作的时候,AI就帮助剪辑师通过特定标签,精准找到需要片段内容,数秒内就可以调出特定人物素材,大大缩短制作时间。 类似的系统和功能,国内各大产都有投入,爱奇艺的智能剪辑,腾讯智能云剪辑,优酷的鲸观剪辑等等。 当然,AI的能力不仅在于提升体验,最重要的,还是帮平台赚钱。
“识别”与流媒体平台的“赚钱引擎”
![003404da66049213352ecae4820999c6.webp](https://filescdn.proginn.com/eeb2f5c98336c54209589b5f191627e1/003404da66049213352ecae4820999c6.webp)
除了常见的,在网站和App上,根据推荐位的权重不同,以及用户的喜好程度推荐视频之外,Netflix还可以利用智能识别到的视频图像信息,生成个性化的视频封面。 比如,一部剧里有很多演员,Netflix会先“识别”出不同的角色和演员,之后专门用你喜欢的演员当封面,类似的还可以应用在不同场景和色调上。 比如下面这个《奇怪物语》,就可以生成无数种不同的封面,角色、场景都不同。
![a5293b1c534b575263790235d781bdb8.webp](https://filescdn.proginn.com/e113b6763f1768f50d74a1deba29f87e/a5293b1c534b575263790235d781bdb8.webp)
另外,还可以根据你看视频的时间和历史内容,体会你的心情变化,推荐不同的视频。比如,一部电影可以有「浪漫」和「惊险」两种风格的封面。你大半夜的,刚看完一部恐怖片,那就会给你用浪漫风格推荐,平复一下心情。
![a12a2d069af14720da8dbb44c38d088d.webp](https://filescdn.proginn.com/4734068820df13504bda9b813c30e4d2/a12a2d069af14720da8dbb44c38d088d.webp)
国内方面,推荐能力各家均有部署。 爱奇艺推出了个性化海报,可以根据用户的喜好,“识别”用户喜欢的海报并推送。去年3月,奇异果TV的首页个性化长视频推荐功能落地,为用户提供千人千面的推荐服务。 除了卖会员,广告也是流媒体平台的重要盈利方式。
在之前,视频的贴片广告,就只是随便地插入到视频里,再正常播放就完事了。广告和视频本身几乎分离,用户体验很差,广告转化率也很低。 后来,YouTube和爱奇艺等头部企业,探索了智能广告插入点,也就是,在适合的情况下插入广告,以减少用户体验的损失。 最近两年,大家又开始探索,怎样能让广告也和视频内容完美切合。 比如,爱奇艺的创可贴广告,会根据AI对视频内容“识别”的结果,比如不同的场景、角色、演员、情绪、动作、台词等,选取广告点位。
之后,在影片播放过程中,以浮层展示不同品牌形象的广告。
基于不同剧情而推送的广告,其内容与视频情节有了关联,用户体验和商品转化率都大幅提升。
去年爆款大剧《延禧攻略》上,这类情景广告就有广泛应用,大受广告主喜爱。 看到爱奇艺最新的“扫一扫”功能,我觉得,全新“电视购物”的时代要来了。 自动识别内容+ 电商链接,绝对是一个新亮点。随便看一个什么综艺啊,现代剧啊,就约等于电视购物。 看到节目里面的明星们,在穿啥用啥吃啥,你突然种草了的话,那就直接“扫一扫”视频画面呗,然后你会知道这些商品是什么,然后去直接购买。 这一定是一个新的电商流量入口,再也不用自己去搜什么“xx同款”了。基于准确的识别,实现了人、货、场的连接。 国际方面,YouTube在2017年就尝试广告内容个性化方案,推出Director Mix工具,方便让广告主根据不用用户定制化广告。 比如,同样一款汤类产品的广告:
如果你在看《星际穿越》,那么贴片的广告语就会是“感到世界之外的饥饿了吗?”
而如果你在看《女子监狱》,广告语就变成了“牢里的饭不好吃?
我们的汤好吃。”
要是你在看碧昂斯的《SingleLady》,那就说“一个人吃晚饭?”
![f5cbd45b917687f273acc19a0939fdd0.webp](https://filescdn.proginn.com/03e1d01cee1aec78e764398b37176d18/f5cbd45b917687f273acc19a0939fdd0.webp)
“识别”技术和未来
![9feb941319155a3ce5293231948753d7.webp](https://filescdn.proginn.com/fcc245c41e759f165ea350b3f02a7fca/9feb941319155a3ce5293231948753d7.webp)
我的新书已出版,感谢支持:Han的新书《硅谷思维》上市了!
评论