复旦大学发布可识别万物的RAM模型
notebook链接:https://www.kaggle.com/code/tiansztianszs/recognize-anything/notebook
Web UI链接:https://huggingface.co/spaces/xinyu1205/Recognize_Anything-Tag2Text
github链接:https://github.com/xinyu1205/Recognize_Anything-Tag2Text/tree/main
notebook解读:
首先克隆仓库:
然后跳转到项目目录文件夹下:
接着将模型复制到项目目录下:
下载待识别的图像:
安装依赖:
最后进行推理:
识别结果如下:
结论:该模型比以往绝大部分模型而言,可以识别更多的物体