亚马逊开发视觉化AI搜索模型，文字自动转图片，提升视觉搜索体验

蓝海亿观网2020年03月03日 196

“亚马逊近日公布，开发了一款新的AI模型，可以把产品描述文字转换成图片，帮助消费者更好查找商品，提升视觉搜索体验。利用GAN网络合成图片，使搜”

亚马逊近日公布，开发了一款新的AI模型，可以把产品描述文字转换成图片，帮助消费者更好查找商品，提升视觉搜索体验。

利用GAN网络合成图片，使搜索体验更直观

亚马逊表示，这款AI模型运用GAN（生成式对抗网络），能够成功合成图片。GAN技术于2014年首次面世。

也就是说，亚马逊开发的这款“视觉化产品搜索AI模型”，主要功能是合成产品图片，所谓文字转图片，这里的图片不是卖家自己提供的产品实图，而是系统根据产品名称或title，自动合成的图片，为消费者查找商品提供更直观的视觉体验，帮助其更快找到心仪的产品。

蓝海亿观网了解到，这款AI新模型，不仅仅可以把搜索结果中的文字转换成图片，另外一个重要的新功能，就是在添加新的产品图片的同时，保留“旧”图片。

举个例子，如果消费者搜索“women’s black pants（女士黑色裤子）”，在搜索结果中会出现相关产品，但原来的文字描述改为图片展示；在“women’s black pants”基础上，添加“capri（卡普里裤，又称为七分裤）”或“petite（小个子）”等其他搜索词，搜索结果会显示新的匹配图片，但之前搜索结果中的产品图片也保留。

除此之外，还有一个颜色模型，能够生成与颜色搜索词更加匹配的图片。

该AI模型分两步合成图片，配有“长短时记忆”组件

据亚马逊所说，该“视觉化产品搜索AI模型”，已经在四个不同的系统上进行测试，而这四个系统都使用StackGAN，一种“文字转图片GAN”。

蓝海亿观网获悉，亚马逊新AI模型，是StackGAN的升级版，分两步生成图片。第一步，直接根据文字生成低分辨率图片；第二步，在生成的低分辨率图片基础上，合成更高清图片，有更细节的纹理和线条，产品颜色也更自然真实。

而且，新AI模型还添加了“长短时记忆”组件，简称LSTM。LSTM和GAN网络结合，能够保证消费者在搜索框中连续输入搜索词时，AI模型能够不断“精炼”对应的产品图，实现输入文字与合成图片高度匹配。（蓝海亿观网egainnews）文末扫码入群，对接跨境电商优质资源。不得擅自改写、转载、复制、裁剪和编辑全部或部分内容，请联系我们授权。

版权说明：蓝海亿观网倡导尊重与保护知识产权,未经许可不得用于商业活动。如当前文章存在版权问题，请联系客服申诉处理。