图像分类:13个Kaggle项目的经验总结
Datawhale
共 5565字,需浏览 12分钟
· 2020-11-27
本文约2800字,建议阅读9分钟
本文作者与你分享图像分类项目经验总结。
Intel Image Classification:https://www.kaggle.com/puneet6060/intel-image-classification Recursion Cellular Image Classification:https://www.kaggle.com/c/recursion-cellular-image-classification SIIM-ISIC Melanoma Classification:https://www.kaggle.com/c/siim-isic-melanoma-classification APTOS 2019 Blindness Detection:https://www.kaggle.com/c/aptos2019-blindness-detection/notebooks Diabetic Retinopathy Detection:https://www.kaggle.com/c/diabetic-retinopathy-detection ML Project — Image Classification:https://www.kaggle.com/c/image-classification-fashion-mnist/notebooks Cdiscount’s Image Classification Challenge:https://www.kaggle.com/c/cdiscount-image-classification-challenge/notebooks Plant seedlings classifications:https://www.kaggle.com/c/plant-seedlings-classification/notebooks Aesthetic Visual Analysis:https://www.kaggle.com/c/aesthetic-visual-analysis/notebooks
数据 模型 损失函数
数据
图像预处理 + EDA
Visualisation:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline#Building-a-baseline-model- Dealing with Class imbalance:https://www.kaggle.com/rohandeysarkar/ultimate-image-classification-guide-2020 Fill missing values (labels, features and, etc.):https://www.kaggle.com/datafan07/analysis-of-melanoma-metadata-and-effnet-ensemble Normalisation :https://www.kaggle.com/vincee/intel-image-classification-cnn-keras Pre-processing:https://www.kaggle.com/ratthachat/aptos-eye-preprocessing-in-diabetic-retinopathy#3.A-Important-Update-on-Color-Version-of-Cropping-&-Ben's-Preprocessing
数据增强
Horizontal Flip:https://www.kaggle.com/datafan07/analysis-of-melanoma-metadata-and-effnet-ensemble Random Rotate and Random Dihedral:https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb Hue, Saturation, Contrast, Brightness, Crop:https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords Colour jitter:https://www.kaggle.com/nroman/melanoma-pytorch-starter-efficientnet
模型
开发一个基线
开发一个足够大可以过拟合的模型
添加更多层 使用更好的结构 更完善的训练流程
结构
Residual Networks Wide Residual Networks Inception EfficientNet Swish activation Residual Attention Network
训练过程
Mixed-Precision Training Large Batch-Size Training Cross-Validation Set Weight Initialization Self-Supervised Training (Knowledge Distillation) Learning Rate Scheduler Learning Rate Warmup Early Stopping Differential Learning Rates Ensemble Transfer Learning Fine-Tuning
超参数调试
正则化
Adding Dropout:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline Adding or changing the position of Batch Norm:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline Data augmentation:https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords Mixup:https://arxiv.org/abs/1710.09412 Weight regularization:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline Gradient clipping:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline
损失函数
Label smoothing Focal loss SparseMax loss and Weighted cross-entropy BCE loss, BCE with logits loss and Categorical cross-entropy loss Additive Angular Margin Loss for Deep Face Recognition
评估 + 错误分析
Tracking metrics and Confusion matrix:https://www.kaggle.com/vincee/intel-image-classification-cnn-keras Grad CAM:https://arxiv.org/pdf/1610.02391v1.pdf Test Time Augmentation (TTA):https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb
最后
评论
轻松掌握开源项目的二次开发技巧
大厂技术 高级前端 Node进阶点击上方 程序员成长指北,关注公众号回复1,加入高级Node交流群本文作者:@方长_beezen 原文链接:https://juejin.cn/post/7358647992608489535前言随着软件行业的迅速
程序员成长指北
0
光纤详解:光纤跳线如何分类,多向单模转换?
本文来自“光纤详解:光纤跳线如何分类,多向单模转换?”,光纤跳线作为光网络布线最基础的元件之一,被广泛应用于光纤链路的搭建中。如今,光纤制造商根据应用场景的不同推出众多类型的光纤跳线,如MPO/LC/SC/FC/ST光纤跳线,单工/双工光纤跳线,单模/多模光纤跳线等,它们之间各有特色,且不可替代。本
架构师技术联盟
0
APP 安全测试项总结
一、安装包测试 1.1、关于反编译 目的是为了保护公司的知识产权和安全方面的考虑等,一些程序开发人员会在源码中硬编码一些敏感信息,如密码。而且若程序内部一些设计欠佳的逻辑,也可能隐含漏洞,一旦源码泄漏,安全隐患巨大。 为了避免这些问题,除了代码审核外,通常开发的做法是对代码进行混淆,混淆后源代
测试开发技术
0
让扩散模型听话的小秘籍?CAN:通过操控权重来控制条件生成模型,图像生成效率大升级!
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 本文提出的 CAN 模型 (Condition-Aware Neural Network) 是一种对图像生成模型添加控制的方法。CAN 可以通过动态操纵神经网络的权重来控制图像生成过程。作者在 ImageNet 图像
极市平台
0
文本嵌入、文本分类和语义搜索
在实践中使用大型语言模型(LLM)中,RAG 的一个关键部分是使用文本嵌入从知识库中自动检索相关信息。在这里,我将更深入地讨论文本嵌入,并分享两个简单(但功能强大)的应用:文本分类和语义搜索。ChatGPT 吸引了全世界对人工智能及其潜力的想象。ChatGPT 的聊天界面是这一影响的关键因素,它使人
大邓和他的Python
0
GPT的风也吹到了CV,详解自回归视觉模型的先驱! ImageGPT:使用图像序列训练图像 GPT模型
作者丨科技猛兽编辑丨极市平台导读 在 CIFAR-10 上,iGPT 使用 linear probing 实现了 96.3% 的精度,优于有监督的 Wide ResNet,并通过完全微调实现了 99.0% 的精度,匹配顶级监督预训练模型。本文目录1 自回归视觉模型的先驱 ImageGPT:
机器学习初学者
0
轻松掌握开源项目的二次开发技巧
点击上方 前端Q,关注公众号回复加群,加入前端Q技术交流群本文作者:@方长_beezen 原文链接:https://juejin.cn/post/7358647992608489535前言随着软件行业的迅速发展,开源项目的重要性已经成为不言而喻的事实。它能够为开发人员节省大量时间和成本,避
前端Q
0
6大类最新AI工具,共计39个分类梳理!
你好,我是郭震俗话说,工欲善其事必先利其器,用好AI工具一定事半功倍!这也是AI技术革命带给我们最能感知到的地方之一。这篇文章总结了6大类AI工具,分别包括:问答,图像,视频,AI编程,AI提示词和AI大模型,一共梳理挑选了共计39个AI工具,其中很多都是开源!文末还包括完整思维导图,大家记得收藏这
Python与算法社区
10