欢迎光临散文网 会员登陆 & 注册

深度学习自动驾驶论文小班一期

2023-02-22 13:54 作者:狮子王万受无疆  | 我要投稿

模型在30个CV数据集上做了实验,实验任务包括OCR, action recognition in videos, geo-localization, and many types of fine-grained object classification。模型在大部分的任务上都达到最佳。而且,一般不用再做specific training,就可以和其他baseline 模型媲美。

数据:4亿个网络公开的图文对。为覆盖到更多的视觉concepts, 用了50w个query在搜索引擎搜索图片,一个query差不多有2w张图片。
输入:一个batch有N个图像文本对;


深度学习自动驾驶论文小班一期的评论 (共 条)

分享到微博请遵守国家法律