
赵凯
赵凯老师现任 上海大学 通信与信息工程学院副教授, 在教育部长江学者特聘教授曾丹教授团队开展多模态大模型、智能工业质检等方向的研究工作。 赵凯老师于 2025 年 8 月加入上海大学,入选上海市及国家级海外高层次人才引进计划。
赵凯老师本科和硕士均毕业于上海大学, 硕士导师是沈为 教授 (现上海交通大学教授);2020年获南开大学计算机科学与技术专业博士学位, 师从程明明教授。 博士毕业后入选腾讯校招技术大咖(T9级技术专家,腾讯校招最高技术职级), 并在腾讯优图实验室担任高级研究员。 2022年起在加州大学洛杉矶分校(UCLA)从事博士后研究,2025年8月加入上海大学任教。
赵凯老师的研究领域主要包括计算机视觉、多视角几何、机器学习。 他在计算机视觉和机器学习相关的顶级期刊和会议上发表论文20余篇, 包括 IEEE TPAMI,、CVPR、NeurIPS、ICCV, ECCV 等顶级期刊和会议, 多篇论文入选 ESI 高被引,谷歌学术总引用 6,000 余次。 赵凯老师关于掌纹识别的研究被《麻省理工科技评论》报道, 并应用于微信刷掌支付、北京地铁大兴机场线刷掌入站中。 赵凯老师是很多开源库(例如 PyTorch 和 mmdetection)的活跃贡献者。
联系方式
- 上海大学宝山校区东区12号楼527室
(发邮件时请说明来意并尽量简洁直接)
教育背景、任职经历:
- Aug 2025~: 副教授,上海大学。
- Mar 2022~Jul 2025: 博士后,加州大学洛杉矶分校,洛杉矶。
- Oct 2020~Feb 2022: 高级研究员,腾讯优图实验室,上海。
- Sep 2018~Jan 2019: 研究实习生,松下研发中心,新加坡。
- Sep 2017~Jun 2020: 博士生,南开大学,天津。
- Jul 2016~Nov 2016: 研究实习生,腾讯优图实验室,上海。
- Sep 2014~Jun 2017: 硕士生,上海大学,上海。
- Sep 2010~Jun 2014: 本科生,上海大学,上海。
代表性学术论文:
- Kai Zhao and Liting Ruan and Haoran Jiang and Xiaoqiang Zhu and Xianchao Zhang and Dan Zeng, "Beyond Predictive Resampling: Learning Input-Agnostic Downsampling for Efficient Aligned Vision Recognition", Proceedings of the AAAI Conference on Artificial Intelligence, 2026. (oral presentation, top 4.5%) [PDF] [Google Scholar]
- Kai Zhao and Wubang Yuan and Zheng Wang and Guanyi Li and Xiaoqiang Zhu and Deng-ping Fan and Dan Zeng, "Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models", Computational Visual Media, 2025. (影响因子=18.3) DOI: 10.26599/CVM.2025.9450512 [PDF] [Google Scholar]
- Kaifeng Pang and Kai Zhao* and Alex Ling Yu Hung and Haoxin Zheng and Ran Yan and Kyunghyun Sung, "NExpR: Neural Explicit Representation for fast arbitrary-scale medical image super-resolution", Computers in Biology and Medicine, 2025. (影响因子=7, 中科院 2 区)(* 通讯作者) DOI: 10.1016/j.compbiomed.2024.109354 [PDF] [Google Scholar]
- Kai Zhao and Alex Ling Yu Hung and Kaifeng Pang and Haoxin Zheng and Kyunghyun Sung, "MRI Super-Resolution with Partial Diffusion Models", IEEE Transactions on Medical Imaging, 2024. (影响因子=11.3, 中科院 1 区, Top期刊) DOI: 10.1109/TMI.2024.3483109 [PDF] [Google Scholar]
- Kai Zhao and Zuojie He and Alex Hung and Dan Zeng, "Dominant Shuffle: A Simple Yet Powerful Data Augmentation for Time-series Prediction", arXiv:2405.16456, 2024. [Google Scholar]
- Kai Zhao and Kaifeng Pang and Alex LingYu Hung and Haoxin Zheng and Ran Yan and Kyunghyun Sung, "A Deep Learning-Based Framework for Highly Accelerated Prostate MR Dispersion Imaging", Cancers, 2024. (影响因子=4.5, 中科院 3 区) DOI: 10.3390/cancers16172983 [PDF] [Google Scholar]
- Alex Ling Yu Hung and Haoxin Zheng and Kai Zhao and Kaifeng Pang and Demetri Terzopoulos and Kyunghyun Sung, "Cross-Slice Attention and Evidential Critical Loss for Uncertainty-Aware Prostate Cancer Detection", International Conference on Medical Image Computing and Computer-Assisted Intervention, 2024. [Google Scholar]
- Kai Zhao and Tao Wang and Ruixin Zhang and Wei Shen, "Adaptive feature alignment for adversarial training", Pattern Recognition Letters, 2024. (影响因子=3.9, 中科院 3 区) DOI: j.patrec.2024.10.004 [PDF] [Google Scholar]
- Alex Ling Yu Hung and Kai Zhao and Haoxin Zheng and Ran Yan and Steven S Raman and Demetri Terzopoulos and Kyunghyun Sung, "Med-cDiff: Conditional medical image generation with diffusion models", Bioengineering, 2023. [Google Scholar]
- Yating Xu and Kai Zhao and Liangang Zhang and Mengyao Zhu and Dan Zeng, "Hyperspectral anomaly detection with vision transformer and adversarial refinement", International Journal of Remote Sensing, 2023. [Google Scholar]
- Kai Zhao and Lei Shen and Yingyi Zhang and Chuhan Zhou and Tao Wang and Ruixin Zhang and Shouhong Ding and Wei Jia and Wei Shen, "B'ezierpalm: A free lunch for palmprint recognition", European Conference on Computer Vision, 2022. DOI: 10.1007/978-3-031-19778-9_2 [PDF] [Google Scholar]
- Xuehui Wang and Kai Zhao and Ruixin Zhang and Shouhong Ding and Yan Wang and Wei Shen, "Contrastmask: Contrastive learning to segment every thing", Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022. [Google Scholar]
- Lei Shen and Yingyi Zhang and Kai Zhao* and Ruixin Zhang and Wei Shen, "Distribution alignment for cross-device palmprint recognition", Pattern Recognition, 2022. (影响因子=7.5, 中科院 1 区, Top期刊)(* 通讯作者) DOI: 10.1016/j.patcog.2022.108942 [PDF] [Google Scholar]
- Jia Li and Junjie Zhang and Fansheng Chen and Kai Zhao and Dan Zeng, "Adaptive material matching for hyperspectral imagery destriping", IEEE Transactions on Geoscience and Remote Sensing, 2022. [Google Scholar]
- Kai Zhao and Xuehui Wang and Xingyu Chen and Ruixin Zhang and Wei Shen, "Rethinking mask heads for partially supervised instance segmentation", Neurocomputing, 2022. (影响因子=5.5, 中科院 2 区) DOI: 10.1016/j.neucom.2022.10.003 [PDF] [Google Scholar]
The list is generated from publications.bib. Please visit my Google Scholar for full publication list.
Academic Services:
- 会议审稿: CVPR, ICCV, ECCV, ICML, ICLR, NeurIPS, AISTAT, ACCV
- 期刊审稿: Nature Communications, IEEE TPAMI, IEEE TIP, IEEE TNNLS, IEEE TMM, Pattern Recognition
- Guest Editor: MDPI Diagnostics
指导过的学生 / 实习生
- Katarina Chiam,UCLA,2023 级硕士生。
- Sohaib Naim,UCLA,2022 级博士生。
- 李润嘉,腾讯优图,实习生。去向:牛津大学 VGG 组博士。
- 庞凯风,UCLA,2022 级硕士生。去向:UCLA 攻读博士。
- Alex Hung,UCLA,2020 级博士生。
- 郑昊昕,UCLA,2020 级博士生。去向:亚马逊。
- 王雪辉,上海交通大学,2020 级博士生。
- 高尚华,南开大学,2018 级博士生。去向:哈佛大学博士后。
给学生的建议
培养长期投入的能力。 长期、稳定、高强度的投入是成功的先决条件。 建议同学们:1)找到一个可以不痛苦地长期投入的方向; 2)至少培养一项兴趣爱好,并借此培养长期专注与执行能力。
请大家思考一个问题:如果高考内容是打游戏,那么 考打游戏上重点大学的和考语数外考上重点大学的是同一批人吗 ? 很多人可能会回答“不是”,但我认为是。
考试成绩好的人,优势不在“会做题”,而在于长期高强度投入、系统化学习以及极强的自我纠错能力; 而在非职业层面,游戏打得好也并非依赖天赋,而是对规则的理解、信息的记忆、以及稳定的执行能力, 这些都需要稳定的长期高强度投入。
不依赖“拼意志”。 把意志力当作一种宝贵的资源,不要去消耗它。 例如刻意培养自己对痛苦和苛刻环境的忍耐力,或者说“没苦硬吃”, 本质上都是在消耗意志力,且并非必要。 拼意志力很容易形成这样的循环: 靠意志力逼自己坚持 → 累 → 崩 → 放弃。 如果你靠意志力逼自己坚持,这在短期可能有效,但长期一定失败, 因为你在使用最昂贵、也最脆弱的资源。
正确的做法是,通过习惯、规则和环境设计,主动减少意志力的消耗:
- 习惯:把“消耗意志力的事”变成“自动发生的行为”。 比如靠意志力每天读一篇论文很难, 但如果固定每天 18–20 点就是读论文时间, 一旦形成习惯,就几乎不再需要意志力介入。
- 规则:把当下的判断前移,用事先设定的规则替代临时决策。 例如不再每天纠结“要不要读论文”, 而是明确规定“18 点坐到书桌前就开始读”, 避免在反复选择中消耗意志力。
- 环境设计:让正确行为更容易发生,让错误行为更难发生。 与其靠意志力抵抗分心, 不如直接调整环境,比如晚上睡觉不玩手机很难,那就手机关机放到手够不到的地方。
研究生入组与培养要求
新生入组要求
- 所有已确定录取的研究生(博士和硕士)须在暑期提前进组,参与科研项目并参加相关课程学习;实验室将协助解决暑期住宿安排。
- 本校保研学生的毕业设计须在实验室完成;外校保研学生如条件允许,也建议在实验室完成毕业设计,以便更好地融入科研工作。
- 考研学生在复试结束后可主动联系实验室参加组内面试。面试通过并确认入组意向后,其入组安排与外校保研学生相同,于大四暑期到校报到并参与实验室科研工作。
相关先修课程和书籍
所有研究生 必须 在入学第一学年结束前完成以下在线课程和教材的学习,通过考核后方可开展科研和学术论文写作。
- 动手学深度学习:教材+课程+代码必修
- 斯坦福-CS231n 深度学习和计算机视觉(b站搬运、中文讲解), 课程中的 Python numpy矩阵编程教程 也很重要,要跟着教程实践必修
- 斯坦福 CS229 机器学习(2018年秋季),(b站搬运)必修
- 麻省理工学院-矩阵方法及其在信号处理和机器学习中的应用必修
- 麻省理工学院-计算机科学教育中缺失的一课(中译版) 这门课边学边在实践中应用,重点了解“ Shell Tools and Scripting,Command-line Environment,Version Control (Git),Debugging and Profiling,Metaprogramming”这几个章节部分章节必修
- 斯坦福 CS234: 强化学习选修
- 计算机视觉中的多视角几何: 这是一本经典教材,有中翻版(但是翻译质量很一般), 建议直接读英文版或者中英对照; 做3D相关的学生必修,其它学生可选修。选修
对于申请阶段的保研和考研学生,如能提前修读并通过相关课程(尤其是 CS231n、CS229),将在导师遴选时获得优先考虑,该课程内容也是面试的重要参考。
研究生论文阅读基本要求
本规范用于指导研究生系统、深入、批判性地阅读高质量论文,培养独立科研判断力,并将论文阅读转化为可复用的研究能力与研究产出。
论文阅读的核心目标不是“看过”,而是逐步做到:读得懂、讲得清、用得上、能质疑。
一、总体要求
论文阅读是科研训练的基本功,是从事科研工作的核心能力之一。 研究生应将系统、深入、批判性地阅读高质量论文作为日常科研工作的组成部分,与算法设计、代码实现和实验分析同等重要。
读论文的目的不仅是理解已有工作,更是形成“理解—评估—迁移—创新”的能力链条,最终服务于自身课题设计与学术论文写作。
二、论文选择要求
1. 论文来源
- 计算机视觉与多模态:优先选取 CVPR、ICCV、ECCV、NeurIPS、ICLR、ICML 等顶会的 Oral 论文;
- 医学影像与视觉分析相关:MICCAI、IEEE TMI、Medical Image Analysis,Nature Methods, Nature Communications, Nature Computational Sciences
- 机器人与智能感知(涉及视觉):ICRA、IROS
Workshop 论文或未经同行评审的 arXiv 论文不建议作为主要阅读对象,仅可作为补充材料,并需明确其不确定性。
2. 论文质量
- 原则上应选择近 3–5 年内发表的高质量论文,例如 Nature 系列子刊、伯克利/CMU/MIT/牛津等顶尖高校一流实验室的研究成果,以及顶级会议的 Oral 论文或 Best Paper 等具有代表性的工作。
- 论文应具备清晰的问题定义、方法创新点和充分的实验验证。
- 优先选择回答“为什么要做”和“为什么这样做”的工作。
- 优先选择代码/数据集公开的工作。
三、阅读深度要求
1. 问题层(Why)
- 论文解决的核心问题是什么,其研究背景和意义是什么。
- 该问题在现有研究体系中的位置,以及现有方法的不足。
要求能够用 3–5 句话准确概括论文“在解决什么问题,以及为什么重要”。
2. 方法层(How)
- 理解方法整体框架、模块组成和数据流, 重点理解各个模块的输入与输出,以及这些输入输出在计算机中的表示形式(例如,图像通常表示为尺寸为 HxWx3 的张量)。
- 明确关键创新点及其设计动机。
- 说清方法与已有方法的本质差异。
3. 实验层(Evidence)
- 实验设计是否合理,数据集和指标是否匹配研究目标。
- 对比方法是否充分且公平。
- 消融实验是否有效验证假设。
- 代码和数据是否公开可得 。
4. 反思与延展(Critical Thinking)
- 方法的隐含假设及可能失效的场景。
- 计算复杂度、工程实现和实际应用限制。
- 与自身研究方向的结合方式与潜在改进点。
四、阅读输出要求
- 完成一次结构化的论文汇报(15–20 分钟)。
- 形成可复用的阅读笔记(Markdown / LaTeX 等)。
- 在条件允许的情况下进行方法复现或关键模块验证。
五、数量与频率要求
- 硕士研究生:每周精读 1 篇,略读 2+ 篇高质量论文。
- 博士研究生:每周精读 2 篇,略读 4+ 篇高质量论文,并形成方向性认识。
六、培养目标
通过系统的论文阅读训练,研究生应逐步具备判断论文价值、拆解复杂模型、设计实验验证假设以及提出自身研究问题的能力。
论文阅读的终点不是“理解别人”,而是“形成自己的研究判断力”。
