redeemer 大佬聊赛事：【美食识别挑战（2）】的四分类问题，怎么破？

点击上方“蓝字”关注“AI开发者”

坐镇大佬

BOSS

redeemer，毕业于电子科技大学，打比赛资深玩家，目前是一名算法工程师。

“美食识别挑战（2）：茄子、山药、苦瓜、西兰花”赛事链接：

https://god.yanxishe.com/26

（点击底部 阅读原文 即可了解更多赛事详情）

AI 研习社：redeemer 大佬好，能否简单介绍一下你的个人背景？

redeemer：坐标北京，目前是一名算法工程师~

AI 研习社：在这次的《美食识别挑战（2）》赛中，你以 99.6495 的优异成绩荣获第一。在这过程中，你认为赛事最大的挑战体现在哪里？

redeemer：首先第一个挑战在于四分类问题对比二分类问题有所区别，所涉及识别维度会有所增加，这对参赛者来说会是一个挑战；

其次，比赛数据集的图片质量各不相同（例如图片大小、分辨率等），因此一定要事先做好预处理工作。

AI 研习社：有没有哪些 baseline 是你觉得比较适合拿来打这场比赛的？原因是什么？

redeemer：我认为自己的 baseline 还不错（笑），主要因为其易于修改。（https://github.com/bochuanwu/aiyanxishe ）；而在 baseline 选用中，最重要的特性之一就是可修改、可理解。

AI 研习社：你认为正确运用好 baseline 的方法是什么？

redeemer：当我们拿到一个不熟悉的 baseline 时，一定要对 baseline 中数据处理、模型框架、训练技巧的代码片段有足够的理解，这样才会更好的做进一步的修改与提升。

AI 研习社：根据你的了解，多分类问题的主要解题思路有哪些？

redeemer：最简单的就是直接有几类分几类，还可以一对一或者一对多策略。

简而言之，就是训练二分类模型，把数据按类别二分，本次比赛中我就用了这种辅助方法。当然除此之外，还有一些比较冷门的方法；其中，我曾经用过的有 CNN 与 SVM 结合的方法。

AI 研习社：本场赛事的数据集具有哪些特点？对你后来的解题思路有哪些启发？

redeemer：本数据集的图片存在模糊、目标偏离正中、一些数据存在目标特征较小（细粒度）等问题；因此，在数据预处理以及模型选择上要有所测试。

AI 研习社：在本次比赛中，你的目标检测网络这块是怎么处理的呢？是否有用到很大的显存？

redeemer：我个人用了多模型融合以及 kfold 方案，模型融合不光采用概率还有投票方法，其中的 wideresnet 以及 efficientnet 还是需要较大显存的。

AI 研习社：参加这样的比赛，你认为感受最深的是什么呢？

redeemer：可以保持对深度学习工具的熟练度，吸取一些别人 baseline 中优秀的思路。

AI 研习社：对于一些刚入门的小白，你有什么经验或建议给到他们吗？

redeemer：多看开源代码，最好有完整注释或者教程。

但对于比赛的 baseline 要注意，并非所有的 baseline 都对新人很友好，要选择易于理解、易于修改的进行研究会更好。

AI 研习社：你认为什么才是打比赛的「正确姿势」？

redeemer：在我看来，主要分 4 步——

第一观察数据；

第二测试模型；

第三模型融合；

最后就是在细节问题上做到坚持不懈！

/ 限时活动 /

第 2 期 “ 分享代码赠日历 ” 活动来了！

2020 年 2 月 27 日 —— 2020 年 3 月 5 日期间，在《美食识别挑战（2）：茄子、山药、苦瓜、西兰花》比赛的“代码方案”上传参赛代码的选手，均有机会获得此前好评不断的 AI 日历 1 本。

扫码了解详情及参与活动

点击 阅读原文，进入美食识别挑战（2）：茄子、山药、苦瓜、西兰花比赛

继续阅读