计算机视觉 · 多模态智能

让机器理解视觉世界,
从像素到认知。

XU & GAN CVLAB 聚焦视觉理解、生成模型与多模态学习,推动基础研究与产业应用的深度融合。

联合单位: 浙江科技大学 × 浙江大学
50+
学术论文
20+
团队成员
15+
合作项目
10+
学术奖项
研究方向

我们在做什么

围绕计算机视觉的核心挑战,展开从基础理论到应用落地的系统性研究。

视觉理解与识别

面向复杂场景的目标检测、分割、行为识别与场景图生成。

生成模型与内容创作

扩散模型、可控生成、3D 生成与视频合成等前沿方向。

多模态学习

视觉-语言预训练、跨模态检索与多模态大模型应用。

查看全部研究方向
核心团队

实验室创始人

X

许老师 Prof. Xu

联合创始人 · 主任

浙江科技大学 信息与电子工程学院

长期从事计算机视觉与模式识别研究,主持多项国家级科研项目。

G

甘老师 Prof. Gan

联合创始人 · 主任

浙江大学 计算机科学与技术学院

专注于生成模型、多模态学习与视觉智能,在顶级会议发表多篇论文。

最新动态

实验室近况

  • 2026.04.10
    PAPER一篇论文被 CVPR 2026 录用

    恭喜团队成员在顶级计算机视觉会议 CVPR 2026 发表论文。

  • 2026.03.22
    AWARD获得 CCF 优秀学生论文奖

    实验室博士生荣获 CCF 颁发的优秀学生论文奖。

  • 2026.02.15
    EVENT实验室正式成立

    XU & GAN CVLAB 在浙江科技大学与浙江大学共同支持下正式成立。

查看全部新闻

加入我们,共同探索视觉智能的未来

我们欢迎有热情、有好奇心的学生与学者加入我们的研究团队。

招生与合作