长江商报消息 颠覆传统搜索功能,“图像搜索”将成人们获取信息常态
本报讯(记者 张齐琪 通讯员 赵雯)点击搜索框里的“相机”图标,对准喜欢的商品,或者把商品拍成照片,系统就会自动帮你找同款——移动时代的这种“以图搜图”,与以往的搜索行为大相径庭。而在未来,实现“所见即所得”,图片搜索将成为人们获取信息的常态。
日前,美国计算机协会(ACM)公布了2015年度杰出科学家名单,阿里巴巴图像搜索领军人物、搜索事业部研究员华先胜位列其中。在他看来,手机淘宝上的“拍立淘”,不仅是搜寻商品的入口,未来还可能成为人们获取信息(包括购物、教育、娱乐、新闻、知识等)的一种习惯——而这背后,在电商“刚需”的引导下,图像搜索迎来厚积薄发的时刻。
电商平台推进图像搜索发展
无论是在杂志电视上,还是商场街头,看到一件心仪的商品,却难以用文字描述,可以在搜索栏点击相机图标,即可进入购物界面拍下照片搜索同款,这就是图片搜索这一可视化搜索方式。
从20世纪90年代开始,国际上就开始了对图像搜索的研究,但直到2008年前后,计算机开始能够处理大量图像,图像搜索技术才得以突飞猛进的发展。
以阿里巴巴集团为例,该集团数据显示,2015年“双11”当天,上千万消费者使用了图像搜索——“拍立淘”功能,引导了超过数千万元的销售额。
与通用搜索主要依靠字节不同,图像搜索被主要定义为 “以图搜图”。华先胜介绍,图像搜索的第一步是训练计算机进行图像理解,也就是通过计算机将图片中的要素,包括人像、颜色、纹理等具体特征以及深度学习产生的图像描述,转化为类似文字的“视觉词”,编成索引之后,才能再进行第二步——图像搜索。
“电商平台是图像技术最具用户‘刚需’的应用场景,特别是以图搜图技术,目前只有电商场景才可以实实在在地产生可观的实际价值,而从另一个角度看,电商平台上大量的用户也是正是推动图像技术发展和应用的基础。”华先胜表示。
语义相同或相似图检索待攻克
“之前,图像识别需要要人工去给图像贴标签,让计算机从这些数据中学习出识别模型,但我们提升了一步,训练计算机自己去找数据,建立自动识别的模型。比如要识别和搜索不同种类的花卉,不用标注900多种花卉的图片,而是直接输入花卉的名称列表,计算机就可以自行去网上找数据,进行清洗、补充、学习,然后就能进行图像识别了。”华先胜表示。
10月27日,在澳大利亚举行的国际顶尖多媒体学术会议ACM Multimedia 2015上,华先胜向在场几百名与会专家分享了“拍立淘”和虚拟化妆等电商应用,“普通用户会觉得好玩,但圈内人会知道我们目前做的一切,包括‘拍立淘’准确度的提升是多么难得,有多大的含金量。”华先胜感叹。
“图像搜索就像电商中的水电煤,有的产品,像‘拍立淘’是可以被用户感知的,有些技术演进则是藏在应用和服务背后,默默为大家服务。”华先胜介绍。
其实电商平台上处处都有图像搜索技术的需求,从商品图片的分析理解、商品识别、商品属性识别、场景识别,到人脸检测、人脸属性、人脸识别、人脸合成等,甚至视频分割、事件检测、物品检测跟踪、广告投放等,都离不开图片技术。
而包括任意图像的语义相同或相似图的检索,是华先胜搜索团队希望下一步攻克的课题——因为用户在拍什么都有可能,可能不是商品,可能是任何物品和场景,如何准确识别并返回对用户有价值的信息,是他们研究的方向。
责编:ZB