西北大学研发猴脸识别技术,金丝猴可刷脸打卡;IJCAI 2020丨基于学习实例隐空间的文本风格转换
开发者社区技术周刊又和大家见面了,快来看看这周有哪些值得我们开发者关注的重要新闻吧。
西北大学研发猴脸识别技术,金丝猴可刷脸打卡
微软下月将为Microsoft Word加入文本预测功能
量子通讯获重大进展:无人机组网成为可能,南大科研团队立功
AutoML大提速,谷歌开源自动化寻找最优ML模型新平台Model Search
计算机行业报告:2023中国私有云IT基础架构支出成为全球第一大市场
重大更新!京东通用目标重识别开源库FastReID V1.0
NeurIPS 2020丨基于能量的OOD检测
IJCAI 2020丨基于学习实例隐空间的文本风格转换
行 业 要 闻
自西北大学的科研团队正依托人工智能等新技术,研发“猴脸识别技术”,用于识别秦岭地区的数千只川金丝猴。与人脸识别技术相似,猴脸识别技术通过提取金丝猴面部特征信息,建立秦岭金丝猴个体的身份信息库,最终扫描、比对、识别。“猴脸识别技术完全成熟后,我们可将其装在野外布设的红外相机中,系统可自动认猴、命名,搜集它们的行为。”研究团队成员张河说。目前,猴脸识别技术处于实验推广阶段,可识别约200只秦岭金丝猴。“每只金丝猴,我们采集了七八百张图像样本,识别成功率达到94%。”
2月22日消息 据Mspoweruser报道,微软将在下个月为Windows版Microsoft Word提供文本预测功能。文本预测功能将根据上下文和机器学习来提示用户接下来可能想要输入的文字。通过更快地编写文档来节省用户时间。此外,这个功能还可以减少拼写和语法错误,并随着时间的推移学习,根据用户的写作风格给出最佳建议。用户只需在 Word 中输入文档,就会注意到预测开始出现。按 TAB 键接受预测,按 ESC 键拒绝预测。微软表示,根据用户在当前文档或电子邮件中键入的文本,文本预测使用机器学习模型来提出建议。但除非作为反馈机制的一部分,否则内容不会被任何人存储或查看。
为满足通用实例重识别日益增长的应用需求,京东AI研究院于2020年6月发布基于PyTorch的通用目标重识别(ReID)开源库FastReID,并受到了许多用户的欢迎与反馈。经过半年多持续优化,2021年1月18日FastReID V1.0携重大更新“惊艳亮相”。具体更新有:
模型蒸馏:小模型部署获得更大的精度提升
定位转型:最全最多的任务支持
面向开发者更友好:自动超参搜索
在新版的升级中,FastReID V1.0不仅为开发者提供了更多通用任务的最小实现模板,还提供了相应的配置文件和参数设定,方便开发者能够基于模板进行特定任务的简单修改。此外,为开发者在使用FastReID开发新项目时提供baseline结果,还能够避免开发者花费大量精力对不熟悉的任务进行调参。
扩展阅读:
美国物理学会和中国《国家科学评论》(National Science Review) 等在内的国际权威机构和期刊,近日刊登了南京大学固体微结构物理国家重点实验室的论文:《Optical-Relayed Entanglement Distribution Using Drones as Mobile Nodes》。论文详细介绍了该团队最近的一项实验,首次将光学中继的节点放到了出于飞行状态的小型无人机上,在分发距离1公里的情况下,仍然高度保持了光子对的纠缠特性,证明了量子链路的有效性。南大团队的这项研究证明了,采用相对更为廉价的小型无人机等设备,完全可以在相对更近的距离内组建量子通讯网络,并且由于无人机的可移动性,组网可以更加灵活,网络的可用性也比卫星量子通讯更高(卫星通讯存在窗口限制)。
为了帮助研究者自动、高效地开发最佳机器学习模型,谷歌开源了一个不针对特定领域的AutoML平台。该平台不针对某个特定域,因而足够灵活,并且能够找出最适合给定数据集和问题的架构,同时最小化编程时间和计算资源。该平台基于TensorFlow框架构建,既可以单机运行,也可以在分布式机器设置上运行。
目前中国的云计算发展已进入快速增长阶段。私有云市场在过去五年保持着年均20%的增长态势。根据Gartner预计,2020年全球私有云市占率将达36%。IDC预测,2023年中国私有云IT基础架构支出将成为全球第一大市场,私有云市场具有较大发展潜力。中国的IaaS(基础设施即服务)呈现起步晚、体量小的特征, 但在近几年呈现爆发式的增长,在新基建的浪潮下,政府、金融、制造业等传统企业上云需求进一步扩大,未来将进一步释放动能,预计年均增长达到40%左右,远高于世界的平均水平。
学 术 前 沿
Academic News
当机器学习模型看到与其训练数据不同的输入时,就会出现out-of-distribution (OOD)uncertainty,因此模型很难对他们进行正确预测(也即在与训练数据分布差距较大的数据点上表现极差)。对于将 ML 应用于安全关键的应用(如罕见疾病鉴定)而言,确定输入是否超出了分布范围是一个基本问题。
在本文中,作者使用energy score来检测OOD输入,ID的数据energy score 低,OOD的数据energy score高。作者详尽证明了energy score优于基于softmax的得分和基于生成模型的方法。相比于基于softmax可信度得分的方法,energy score不太受到NN在样本空间过拟合的影响。相比于基于生成模型的方法,energy score又不需要进行显式的密度估计。
*论文链接:https://arxiv.org/abs/2010.03759
文本风格自动转换是一个有趣的任务。由于缺乏平行语料,大多数工作致力于实现无监督的风格转换并且取得了一定的效果。现有的方法大多通过将风格和内容进行解耦来实现转换,但是由于解耦的复杂性,这些模型往往无法兼顾转换后文本的内容保留度和风格准确度。我们在该工作中提出了一个新的方法,利用流 (flow) 模型,基于多个风格实例来构建更强的风格信号,以此增强转换后文本的风格准确性,并在风格以及内容两个指标上取得了更好的平衡。同时,我们的模型也适用于半监督训练,可以利用少量平行数据进一步提升转换效果。
*论文链接:https://arxiv.org/abs/2004.02709
*以上信息来源于网络,由“京东科技开发者”公众号编辑整理,
不代表京东科技立场*