欢迎光临散文网 会员登陆 & 注册

【VALSE2023】0611《Workshop :围绕手机的计算影像学》

2023-08-14 15:50 作者:墨天明-MoreTiming  | 我要投稿

当A(学术)遇到I(工业)


00:03



28:12


A和I的距离和冲突

本质上是数据和度量的问题:

  1. 学术界训练数据和实际情况不是同分布的,导致泛化出bug
  2. 合成数据(人造退化)与真实数据之间的gap
  3. 真实数据采集的困境(去噪已有系统的解决方案)
  4. 学术界和工业界的度量评价指标不一致,优化方向不同
  5. 现有的客观指标无法准确描述主观视觉质量
  6. 学术界的度量方式在工业界略显naive(指不实用,不是说不够复杂)



34:07



展望

  1. 实用高效小模型
  2. 本人在做的就是这个方向的工作,只不过我主攻的是数据不是模型
  3. 网络结构还是让工业界自己优化吧,小网络对算子的要求太高了,脱离生产搞不出来能实用的东西,太贴近生产又很难升华出能发paper的东西……
  4. 底层视觉大模型
  5. 个人认为,复原式生成大模型有的搞,生成式复原大模型要求太高了,人眼到现在都还有视错觉呢。
  6. 我其实一直也想搞生成式复原,但一是资源不够,二是没想清楚怎么合理地优雅地解决这个任务。
  7. 暴力的解法其实挺多的了(不过生成模型普遍在实战中会遇到更严重的OOD问题


【VALSE2023】0611《Workshop :围绕手机的计算影像学》的评论 (共 条)

分享到微博请遵守国家法律