AISS1 视觉

Score Policy

分数组成 占比(%)
平时分 35
proj-2~3人组队进行Facechain新风格化生成-提交PR:zju_组名_XXX
9.8中期报告:学习review + 项目计划(~1000字)
9.15 项目答辩, final version
65

概况

完整链路 :内容-信号增强-压缩技术-计算处理-输出端

应用举例: 电梯拥挤程度、基于遥感的、瑕疵检测等

分类树

  • 模态

  • 对象

  • 功能

  • 场景:工业、电商

  • 图象技术

  • 视频技术(基于图像技术的增加时域的):场景识别、检测分割生成etc

  • 3d视觉:渲染呈现,AR,VR

整体趋势

  • 功能:从理解到生成
  • 模型参数:从小到大
  • 模态&任务:从单到多
  • 对象:从闭(集)到开(集)
  • 基于知识和反馈的训练(e.g.将人类的反应纳入训练过程+强化学习)

视觉感知理解技术

  1. 物品识别/人脸识别/生物识别
  2. 图象分类&检测:VIT,YOLOK
  3. ai for medic/交通/人体关键点
  4. 分割

经典生成编辑技术

发展历程

GAN - 扩散模型 - GAN+ - DDPM - 扩散+ - SD

  • For 视觉生产:

    视频增强: 清晰度(超分),色彩增强,去抖动,去噪,
    生成编辑: 风格化,视觉生成

视觉大模型

SAM / Grounded SAM

Control Net: 可控的图象生成

Composer: 可组合的图象生成


AISS1 视觉
http://example.com/2023/09/04/AISS-1/
Author
Tekhne Chen
Posted on
September 4, 2023
Licensed under