深度学习VIT论文小班

2023-02-25 17:38 作者:al_sa 0人读过 | 我要投稿

这是一个新的学习概念吗？不是，但它是迄今为止最有“野心的”的。OpenAI收集了一个包含 4 亿个图像+文本对的数据集来训练这个模型：对于文本编码使用修改后的 Transformer 架构，对于图像编码使用 ResNet-50、ResNet-101、EfficientNet 和 Vision Transformers（均已修改）。通过对比测试表现最好的是 Vision Transformer ViT-L/14。

标签：

深度学习VIT论文小班

深度学习VIT论文小班的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

深度学习VIT论文小班

本文作者的其他文章

深度学习VIT论文小班的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

深度学习VIT论文小班的评论 (共条)