拍立淘创始人潘攀博士为你揭开“以图搜图”的神秘面纱!
共 2093字,需浏览 5分钟
·
2021-04-27 07:55
当你无意中看到一件心仪的衣服,却不知道它的品牌、条码等信息,也不知道怎么在淘宝中搜同款时,有没有尝试用过淘宝中拍照搜商品的功能呢?
通过拍照来搜索商品(简称“以图搜图”),在淘宝中被称为“拍立淘”。
“拍立淘,用镜头淘世界。”
上传一张服装照片、搜索相似款,就能轻松找到优选的心仪服装!
这一技术,颠覆了只能通过文字搜索商品的方式!
没错儿,这背后的黑科技就是——
基于深度学习的图像搜索与识别技术!
图像搜索,即基于图像内容的图像检索。
这项技术的相关应用,看似近年来才刚刚走入我们的生活,但其实早在20世纪90年代末,它便在计算机视觉领域吸引了广泛的关注。
图像搜索研究中的一个核心问题就是“如何有效地表征图像的视觉内容”。
在深度学习技术被广泛应用之前,业界尝试了很多基于传统视觉技术的方法,但无法有效表征自然界中多样的视觉内容,因而效果不佳。
在近二十年的艰难求索后,得益于深度学习的发展和推动,图像搜索和识别的精度和效率都有了极大提升,使其不仅在学术圈非常火热,在工业界也引人注目。
从2014年开始,经过6年之久的持续打磨,阿里巴巴的视觉算法团队在超大规模图像搜索方向取得了引人注目的成绩,拍立淘正是这一成果的体现!
那么,拍立淘高品质搜索和精准推荐的背后,到底有什么魔法?
这次,我们请出大神——拍立淘的创始人和负责人,来自达摩院的阿里巴巴集团资深算法专家潘攀(启磐)博士,看看他是如何为我们一探究竟的!
潘攀博士将全部奥秘都写在了这本书里:
对于想要掌握这一技术的小伙伴来说,arxiv.org和各个学术会议上有层出不穷的论文、深度学习的多种开源框架,开源社区中有各种代码,都可以用来学习和研究。然而,“乱花渐欲迷人眼”,过于繁杂的信息和知识反而让初学者感觉无从下手。
仅CVPR2019就收录了1294篇论文,如果每天看3篇,全部看完也需要大概一年多的时间。丰富的信息在提供便利的同时,也给迅速筛选和获取有效信息增加了难度。
如果你想要学习图像搜索技术,又恰好有上面这些困扰,那么《深度学习图像搜索与识别》这本书可谓是你学习路上的一位当仁不让的领路人!
▊ 权威作者
本书由拍立淘以图搜图的负责人和创始人之一,阿里巴巴集团资深算法专家,达摩院视觉理解&互动视觉负责人潘攀博士亲自撰写,其权威性不可置否,同时极具理论和实践双重价值!
▊ 回归基础
本书将近年来的算法进展和核心场景用体系化、代码化的方式做了一一呈现,不仅能够帮助你迅速理清计算机视觉领域的技术脉络,还能让你在亿级图像搜索产品的实战案例中学以致用,降低学习成本。
▊ 循序渐进
本书依次介绍了构成图像搜索和识别系统的各个算法基础模块,并在最后一章以拍立淘为例说明了各个模块是怎样一起工作的。
▊ 深入原理
对于每个算法模块,本书不仅深入浅出地解释算法的工作原理,还对算法背后的演进机理和不同方法的特点进行了说明,在第2至8章末尾均提供了经典算法的PyTorch代码和相关参考资料,十分详尽。
▊ 经验真实
本书不仅介绍了大规模图像搜索和识别的相关基础技术知识,而且涵盖了作者在拍立淘的创立过程中构建图像搜索和识别系统的成功经验,及其对技术和应用场景的深刻理解,这是本书独一无二之处。
▊ 适用性强
本书既适合图像搜索和识别领域的初学者,也适合在某个单一任务方面有经验但是想扩充知识面的读者。
如果你想知道:
图像搜索识别系统开发需要解决哪些问题?
深度学习在图像识别领域的前沿技术是什么?
数十亿级图像搜索是如何实现的?阿里巴巴拍立淘是如何构建的?
……
那么本书绝对不容错过!
金榕、徐盈辉、贾扬清等业内大牛纷纷
▊《深度学习图像搜索与识别(全彩)》
潘攀 著
首度剖析基于深度学习的亿级图像检索技术平台
深度分析计算机视觉重要算法原理与应用场景
阐述构建大规划图像搜索平台思路、技巧与落地经验
图像搜索和识别是计算机视觉领域一个非常重要且基础的题目。本书对构成图像搜索和识别系统的各个算法基础模块一一做了介绍,并在最后一章以拍立淘为例说明了各个模块是怎样一起工作的。针对每个算法模块,本书不仅深入浅出地解释了算法的工作原理,还对算法背后的演进机理和不同方法的特点进行了说明,在第2章至第8章最后均提供了经典算法的PyTorch 代码和相关参考资料。
本书既适合图像搜索和识别领域的初学者,也适合在某个单一任务方面有经验但是想扩充知识面的读者。
(扫码了解本书详情)
如果喜欢本文 欢迎 在看丨留言丨分享至朋友圈 三连 热文推荐
▼点击阅读原文,获取本书详情~