亚马逊开发视觉化AI搜索模型,文字自动转图片,提升视觉搜索体验

蓝海亿观网2020年03月03日 196

亚马逊近日公布,开发了一款新的AI模型,可以把产品描述文字转换成图片,帮助消费者更好查找商品,提升视觉搜索体验。利用GAN网络合成图片,使搜

亚马逊近日公布,开发了一款新的AI模型,可以把产品描述文字转换成图片,帮助消费者更好查找商品,提升视觉搜索体验。

利用GAN网络合成图片,使搜索体验更直观

亚马逊表示,这款AI模型运用GAN(生成式对抗网络),能够成功合成图片。GAN技术于2014年首次面世。

也就是说,亚马逊开发的这款“视觉化产品搜索AI模型”,主要功能是合成产品图片,所谓文字转图片,这里的图片不是卖家自己提供的产品实图,而是系统根据产品名称或title,自动合成的图片,为消费者查找商品提供更直观的视觉体验,帮助其更快找到心仪的产品。

蓝海亿观网了解到,这款AI新模型,不仅仅可以把搜索结果中的文字转换成图片,另外一个重要的新功能,就是在添加新的产品图片的同时,保留“旧”图片

举个例子,如果消费者搜索“women’s black pants(女士黑色裤子)”,在搜索结果中会出现相关产品,但原来的文字描述改为图片展示;在“women’s black pants”基础上,添加“capri(卡普里裤,又称为七分裤)”或“petite(小个子)”等其他搜索词,搜索结果会显示新的匹配图片,但之前搜索结果中的产品图片也保留。

除此之外,还有一个颜色模型,能够生成与颜色搜索词更加匹配的图片

该AI模型分两步合成图片,配有“长短时记忆”组件

据亚马逊所说,该“视觉化产品搜索AI模型”,已经在四个不同的系统上进行测试,而这四个系统都使用StackGAN,一种“文字转图片GAN”。

蓝海亿观网获悉,亚马逊新AI模型,是StackGAN的升级版,分两步生成图片。第一步,直接根据文字生成低分辨率图片;第二步,在生成的低分辨率图片基础上,合成更高清图片,有更细节的纹理和线条,产品颜色也更自然真实。

而且,新AI模型还添加了“长短时记忆”组件,简称LSTM。LSTM和GAN网络结合,能够保证消费者在搜索框中连续输入搜索词时,AI模型能够不断“精炼”对应的产品图,实现输入文字与合成图片高度匹配。(蓝海亿观网egainnews)文末扫码入群,对接跨境电商优质资源。不得擅自改写、转载、复制、裁剪和编辑全部或部分内容,请联系我们授权。

版权说明:蓝海亿观网倡导尊重与保护知识产权,未经许可不得用于商业活动。如当前文章存在版权问题,请联系客服申诉处理。

分享至:

蓝海亿观网跨境卖家交流群!

跨境24H头条资讯,关注跨境平台最新政策推送行业最新动态。

全球跨境市场分析、电商政策及选品思维逻辑解读。

知名跨境大卖财报分析,真实案例分析站内站外引流促单实操技巧!

扫码入群,与同行共赢

留点想法

评论列表(0条)