欢迎光临散文网会员登陆 & 注册

【VALSE2023】0611《Workshop ：围绕手机的计算影像学》

2023-08-14 15:50 作者:墨天明-MoreTiming 0人读过 | 我要投稿

当A(学术)遇到I(工业)

00:03

略

28:12

A和I的距离和冲突

本质上是数据和度量的问题：

学术界训练数据和实际情况不是同分布的，导致泛化出bug
合成数据（人造退化）与真实数据之间的gap
真实数据采集的困境（去噪已有系统的解决方案）
学术界和工业界的度量评价指标不一致，优化方向不同
现有的客观指标无法准确描述主观视觉质量
学术界的度量方式在工业界略显naive（指不实用，不是说不够复杂）

34:07

展望

实用高效小模型
本人在做的就是这个方向的工作，只不过我主攻的是数据不是模型
网络结构还是让工业界自己优化吧，小网络对算子的要求太高了，脱离生产搞不出来能实用的东西，太贴近生产又很难升华出能发paper的东西……
底层视觉大模型
个人认为，复原式生成大模型有的搞，生成式复原大模型要求太高了，人眼到现在都还有视错觉呢。
我其实一直也想搞生成式复原，但一是资源不够，二是没想清楚怎么合理地优雅地解决这个任务。
暴力的解法其实挺多的了（不过生成模型普遍在实战中会遇到更严重的OOD问题

标签：

【VALSE2023】0611《Workshop ：围绕手机的计算影像学》的评论 (共条)