亚马逊李沐团队提出：行为识别的全面调研（2014-2020）

共 789字，需浏览 2分钟

·

2020-12-26 04:52

新智元报道

来源：CVer

作者：Amusi

【新智元导读】本文对基于深度学习的视频行为识别论文进行了全面调研，按时间顺序详细介绍并盘点出重要工作，还统计出了17个视频行为识别数据集，最后还复现了大量优秀工作的代码，现已开源！

论文：https://arxiv.org/abs/2012.06567

模型库介绍链接：

https://cv.gluon.ai/model_zoo/action_recognition.html

视频行为识别是视频理解的代表性任务之一。在过去的十年中，由于深度学习的出现，我们见证了视频行为识别的巨大进步。但是我们也遇到了新的挑战，包括对视频中的远程时间信息进行建模，高昂的计算成本以及由于数据集和评估协议差异而产生的无与伦比的结果。

在本文中，我们对200多篇有关深度学习的视频行为识别现有论文进行了全面调查。

数据集

我们首先介绍影响模型设计的17个视频动作识别数据集，比如Kinetics700、AVA等等。如下图所示：

视频动作识别模型

然后，我们按时间顺序介绍了视频动作识别模型：

从适应深度学习的早期尝试开始，然后到双流网络，接着是3D卷积内核的采用，最后是最近的计算效率高的模型。

此外，我们在几种代表性数据集上对流行方法进行了基准测试，并发布了可复现的代码：Action Recognition。

最后，我们讨论了未解决的问题，并阐明了视频动作识别的机会，以促进新的研究思路。

论文PDF：

链接：https://pan.baidu.com/s/1q2Niy9jYacK9mwrHftNx5Q

提取码：cver

浏览 25

点赞

收藏

分享

举报

评论

图片

表情

文字识别的软件

在如今这个快节奏、高速发展的社会，无论做什么都需要讲究效率，工作、学习、办理业务等等，一切以效率为王。OCR文字识别软件，则在科技成果的催化下应运而生。简单好用的OCR文字识别软件，让一切像开挂一样。中安未来OCR文字识别技术有着多年成熟发展的历史，到如今产业化、战略化的发展，一路走来，其识别准确率、识别速度，得到广泛认可。以核心OCR技术为基础，根据不同行业领域不同需求，研发出护照阅读器智能硬件，以及银行卡识别、身份证识别、行驶证识别、车牌识别、名片识别等识别在文字识别领域，中安未来支持中文、日文、阿拉伯文、英文、德文、韩文、意大利文、法文、藏文、维吾尔文等几十种语言文字识别。支持自动矫正、旋转，同时可直接导入

文字识别的优点

文字识别，是所有衍生识别应用的根基，依托强大的研发团队和数十载技术积累，专为智能化而生。无论是资料检索、文字检测，还是内容监管、视频内容分析等，基于业界领先的OCR识别技术，能为您提供多场景、多语言、高精度的图文检测识别服务。其中中文、英文、日文、阿拉伯文的识别精准性，在业内有着较高的知名度。中安未来文字识别产品的五大优点：准确性高：中安未来文字识别OCR，可识别中文、英文、日文、韩文、阿拉伯文、意大利文、维吾尔文等几十种文字。其核心OCR自主研发技术，经过不断的完善和更新，已相当成熟，识别准确率高。稳定性强：文字识别OCR核心早已成功应用于Microsoft、Nuance、OPENTEXT、中国工商

文字识别的应用

是否有过这样的经历，在网上发现一篇好文，却没办法复制，怎么办？手动抄录吗，我想如果没有OCR，大部分人会这么做。 OCR是一种图像处理技术，又叫文字识别，能够将图像中不可复制的文字转换成可编辑的文字形式，简单来说，用户对无法复制的文本进行拍照，通过文档识别软件进行识别，即可获得可编辑、可保存的电子文档信息。工作生活中，经常会遇到档案录入、纸质信息读取、客户名片资料存储等工作，如果单纯使用人工去录入信息，繁琐复杂没有效果，OCR、文字识别、数字化路程就这样慢慢形成了。中安未来，文字识别技术，可以这这些实现，提高工作效率。中安未来的OCR文字识别技术，将纸质文档数字化，相比一个字一个字的录入，这种批量识别存储的方法不仅提高了纸质文

文字识别的优点

文字识别，是所有衍生识别应用的根基，依托强大的研发团队和数十载技术积累，专为智能化而生。无论是资料检索、文字检测，还是内容监管、视频内容分析等，基于业界领先的OCR识别技术，能为您提供多场景、多语言、高精度的图文检测识别服务。其中中文、英文、日文、阿拉伯文的识别精准性，在业内有着较高的知名度。文字识别产品的五大优点：准确性高：文字识别OCR，可识别中文、英文、日文、韩文、阿拉伯文、意大利文、维吾尔文等几十种文字。其核心OCR自主研发技术，经过不断的完善和更新，已相当成熟，识别准确率高。稳定性强：文字识别OCR核心早已成功应用于Microsoft、Nuance、OPENTEXT、中国工商银行、央视网、恒丰银行、华信

人脸识别的可解释性

人脸识别的可解释性

小白学视觉

文字识别的小方法

人们在生活或工作中经常遇到图片文字识别的问题。他们是怎么识别出来的？今天，让我们分享一个简单快捷的方法。如果你需要，就来了解它。图片文字识别解决方法：可通过OCR文字识别软件来解决。 OCR 文字识别软件利用 OCR 技术将图片转换成可编辑的文字，它可以帮助你识别多种票据和多种文件格式的图片，支持各种文档： JPG 、 PNG 、 PDF 等快速精准识别，实现文档数字化，如果想要识别图片的话， OCR文字识别就可以帮你解决了。典型应用： 1. 档案管理软件商：紫光软件、珠海泰坦、上海中信、凯普软件等； 2. 资源管理软件及出版软件商：方正阿帕比、方正电子、万方数据、TRS等； 3. OA办公自动化软件商：中软、中科软

人脸识别的可解释性

AI算法与图像处理

开源｜CVPR 2021：第一个针对行为识别的黑盒攻击算法BASAR

亚马逊首席科学家李沐博士：工作五年反思

机器学习算法与Python实战