Facebook 正在研究新型 AI 系统,以自我视角与世界进行交互
Facebook AI 推出 Ego4D
AI 也可以体验第一视觉
Ego4D 的第一个基准挑战是情景记忆(Episodic memory)。
关键就是什么时候发生的?AI 可以通过检索过去以自我为中心的视频中的关键时刻来回答自由形式的问题并扩展个人记忆。
下一步就是进行预测:接下来可能会做什么?
第三个挑战基准就是手-物之间的互动(Hand and object manipulation)也是难点和关键的一步,因为AI需要理解在做什么,如何做?
学习手如何与物体互动对于AI指导我们的日常生活至关重要。AI必须检测第一人称的人-物交互,识别抓取,并检测物体状态变化。这种推动力也受到机器人学习的推动,机器人可以通过视频中观察到的人们的经验间接获得经验。
如果你正在上一堂重要的课,但因收到的信息而分了心,你可以问AI:“教授把我们的试卷收上去之后,课堂讨论的主要话题是什么?”
这个就是第四个挑战基准 - 视听分类
我正在与谁互动,如何互动?例如“如何在嘈杂的地方更好地听到别人说话的声音”
社会互动(Social interaction)是 Ego4D 的最后一个方向。
除了识别视觉和声音提示外,理解社交互动是智能 AI 助手的核心。一个社交智能的 AI 会理解谁在和谁说话,谁在关注谁。
解开真实数据集
Ego4D 及以后的下一步是什么?
https://venturebeat.com/2021/10/14/facebook-introduces-dataset-and-benchmarks-to-make-ai-more-egocentric/
https://ai.facebook.com/blog/teaching-ai-to-perceive-the-world-through-your-eyes/
评论