【VALSE2023】0611《Workshop :围绕手机的计算影像学》
2023-08-14 15:50 作者:墨天明-MoreTiming | 我要投稿

当A(学术)遇到I(工业)
00:03
00:03
略
28:12
A和I的距离和冲突
本质上是数据和度量的问题:
- 学术界训练数据和实际情况不是同分布的,导致泛化出bug
- 合成数据(人造退化)与真实数据之间的gap
- 真实数据采集的困境(去噪已有系统的解决方案)
- 学术界和工业界的度量评价指标不一致,优化方向不同
- 现有的客观指标无法准确描述主观视觉质量
- 学术界的度量方式在工业界略显naive(指不实用,不是说不够复杂)





34:07
34:07
展望

- 实用高效小模型
- 本人在做的就是这个方向的工作,只不过我主攻的是数据不是模型
- 网络结构还是让工业界自己优化吧,小网络对算子的要求太高了,脱离生产搞不出来能实用的东西,太贴近生产又很难升华出能发paper的东西……
- 底层视觉大模型
- 个人认为,复原式生成大模型有的搞,生成式复原大模型要求太高了,人眼到现在都还有视错觉呢。
- 我其实一直也想搞生成式复原,但一是资源不够,二是没想清楚怎么合理地优雅地解决这个任务。
- 暴力的解法其实挺多的了(不过生成模型普遍在实战中会遇到更严重的OOD问题