精选项目论文:高性能视觉库、文本生成序列模型的有效实现
共 2941字,需浏览 6分钟
·
2021-09-14 12:49
Caer 是一个轻量级、高性能的视觉库,用于高性能 AI 研究。通过抽象出不必要的样板代码来简化计算机视觉方法,能够灵活地快速构建深度学习模型和研究想法的原型。最终结果是一个设计完全不同的库,它易于理解,与其他人一起,使用起来很有趣。优雅的,经过类型检查的 API 和设计理念使 Caer 成为学生、研究人员和爱好者的理想选择甚至是深度学习和计算机视觉领域的专家。
Caer 是一个 Python 库,由以下组件组成:
项目地址:
https://github.com/jasmcaus/caer
解决方案的途径:
我们使用一个简单的级联框架来分割结节,它可以很容易地扩展到其他单目标分割任务。
我们在解决方案中所做的是:
预处理去除不相干的区域
实验级联框架 -五折交叉验证(CV)策略,平衡结节大小和种类分布
使用TTA(Test time augmentation)
模型整体:由于我们在五折CV中分别训练了两个网络,我们将任意一个第一个网络和一个第二个网络组合成一对,最后我们得到25对(或推理结果)我们用step4_Merge.py 通过像素投票将25个推断结果合并成最终的集合结果
在2020TN-SCUI训练集上测试了我们的方法3644张图像或结节,恶性2003:良性1641)。基于“DeeplabV3+ with efficientnet-B6 encoder”的五折CV分割结果如下:
已经在以下环境中测试了代码:
segmentation_models_pytorch == 0.1.0
ttach == 0.0.3
torch >=1.0.0
torchvision
imgaug
项目地址:
https://github.com/WAMAWAMA/TNSCUI2020-Seg-Rank1st
03 mfastseq 用于文本生成、摘要和翻译任务的流行序列模型的有效实现
FastSeq 为文本生成、摘要、翻译任务等提供了流行序列模型(例如 Bart、ProphetNet)的高效实现。它基于流行的 NLP 工具包(例如 FairSeq 和 HuggingFace-Transformers)自动优化推理速度,而不会损失准确性。所有这些都可以轻松完成(如果使用我们的命令行工具,则无需更改任何代码/模型/数据,如果使用源代码,则只需添加一行代码 import fastseq)。
特性:
EL-Attention:用于生成的内存高效无损注意力
基于 GPU 的块 N-Gram 重复
用于后处理的异步管道
下面显示了使用 FastSeq 的生成速度增益:
FastSeq 开发了多种加速技术,包括注意力缓存优化、检测重复 n-gram 的有效算法以及具有并行 I/O 的异步生成管道。这些优化支持各种基于 Transformer 的模型架构,例如编码器-解码器架构、仅解码器架构和仅编码器架构。 FastSeq 中更高效的实现将自动修补以替换现有 NLP 工具包(例如 HuggingFace-Transformers 和 FairSeq)中的实现,因此无需大的代码更改即可将 FastSeq 与这些工具包集成。
环境配置:
Python version >= 3.6
torch >= 1.4.0
fairseq == 0.9.0
transformers == 3.0.2
requests >= 2.24.0
absl-py >= 0.9.0
rouge-score >= 0.0.4
项目地址:
https://github.com/microsoft/fastseq
04 Rath 基于增强分析技术的可视化分析工具
Rath是新一代的基于增强分析技术的可视化分析工具,它提供了自动化的数据探索分析能力与自动可视化设计能力。Rath既可以在你对数据无从下手时提供分析入口的建议,也可以在你的分析过程中提供实时的分析辅助和建议。Rath会帮你完成大部分数据探索分析的工作,使得你可以专注于领域问题本身。当数据越复杂时,Rath的自动化能力带来的优势就越加显著。
Rath 可能帮助你快速完成对一个数据集的自动化可视化分析。它既可以帮助你在自助分析时提供实时的建议,也可以直接根据数据实时的特征生成数据报表。与其他的一些自动化数据探索分析工具只能推荐简单的低维统计特征不同,Rath可以推荐包含一些深层规律的高维可视化,这使得你可以深度的探索数据。
Rath 可以根据人眼的视觉感知的准确度进行可视化设计,这使得Rath设计的可视化可以被更准确的理解。这是基于感知学领域的实验数据设计的最优化算法,而不是一些不可量化的设计经验。
相比于tableau、Congos Analytics等可视化分析工具,Rath可以大幅降低数据分析的门槛,使用户可以关注于实际的问题。
相比于PowerBI、帆软等报表搭建工具,Rath可以制作动态的可视化报表。使得你的报表可以针对数据的特性实时变化,始终把重要的问题暴露出来。
与其他大多数增强分析或自动化可视化工具不同,Rath提供高维的复杂洞察发现能力与针对高维数据的可视化推荐技术。这使得Rath可以发现更深层次的洞察和线索,而不是局限在简单的低维可视化所展示的基础统计特征上。
项目地址:
https://github.com/Kanaries/Rath
— 推荐阅读 — NLP ( 自然语言处理 )
CV(计算机视觉)
推荐
最新大厂面试题
AI开源项目论文
戳↓↓“阅读原文”领取《名企AI面试100题》PDF!