计算机视觉 · 多模态智能

让机器理解视觉世界，
从像素到认知。

XU & GAN CVLAB 聚焦视觉理解、生成模型与多模态学习，推动基础研究与产业应用的深度融合。

联合单位： 浙江科技大学 × 浙江大学

浏览研究方向了解团队

50+

学术论文

20+

团队成员

15+

合作项目

10+

学术奖项

研究方向

我们在做什么

围绕计算机视觉的核心挑战，展开从基础理论到应用落地的系统性研究。

①

视觉理解与识别

面向复杂场景的目标检测、分割、行为识别与场景图生成。

②

生成模型与内容创作

扩散模型、可控生成、3D 生成与视频合成等前沿方向。

③

多模态学习

视觉-语言预训练、跨模态检索与多模态大模型应用。

查看全部研究方向

核心团队

实验室创始人

许老师 Prof. Xu

联合创始人 · 主任

浙江科技大学信息与电子工程学院

长期从事计算机视觉与模式识别研究，主持多项国家级科研项目。

个人主页 Email

甘老师 Prof. Gan

联合创始人 · 主任

浙江大学计算机科学与技术学院

专注于生成模型、多模态学习与视觉智能，在顶级会议发表多篇论文。

个人主页 Email

实验室近况

2026.04.10

PAPER一篇论文被 CVPR 2026 录用

恭喜团队成员在顶级计算机视觉会议 CVPR 2026 发表论文。
2026.03.22

AWARD获得 CCF 优秀学生论文奖

实验室博士生荣获 CCF 颁发的优秀学生论文奖。
2026.02.15

EVENT实验室正式成立

XU & GAN CVLAB 在浙江科技大学与浙江大学共同支持下正式成立。

查看全部新闻

加入我们，共同探索视觉智能的未来

我们欢迎有热情、有好奇心的学生与学者加入我们的研究团队。

招生与合作

让机器理解视觉世界， 从像素到认知。