AISS1 视觉
Score Policy
分数组成 | 占比(%) |
---|---|
平时分 | 35 |
proj-2~3人组队进行Facechain新风格化生成-提交PR:zju_组名_XXX 9.8中期报告:学习review + 项目计划(~1000字) 9.15 项目答辩, final version |
65 |
概况
完整链路 :内容-信号增强-压缩技术-计算处理-输出端
应用举例: 电梯拥挤程度、基于遥感的、瑕疵检测等
分类树
-
模态
-
对象
-
功能
-
场景:工业、电商
-
图象技术
-
视频技术(基于图像技术的增加时域的):场景识别、检测分割生成etc
-
3d视觉:渲染呈现,AR,VR
整体趋势
- 功能:从理解到生成
- 模型参数:从小到大
- 模态&任务:从单到多
- 对象:从闭(集)到开(集)
- 基于知识和反馈的训练(e.g.将人类的反应纳入训练过程+强化学习)
视觉感知理解技术
- 物品识别/人脸识别/生物识别
- 图象分类&检测:VIT,YOLOK
- ai for medic/交通/人体关键点
- 分割
经典生成编辑技术
发展历程
GAN - 扩散模型 - GAN+ - DDPM - 扩散+ - SD
-
For 视觉生产:
视频增强: 清晰度(超分),色彩增强,去抖动,去噪,
生成编辑: 风格化,视觉生成
视觉大模型
SAM / Grounded SAM
Control Net: 可控的图象生成
Composer: 可组合的图象生成
AISS1 视觉
http://example.com/2023/09/04/AISS-1/