什么是跨模态检索 (cross-model retrieval)?以图像、文字跨模态检索为例

信息有多种表现形式,例如文字与图片。

如何找到一种模态对应的其他模态的数据?这就是跨模态检索问题。

 

有论文提出使用场景图来解决这个问题:
 

版权声明:本文为artistkeepmonkey原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。