1月3日(周三)
沙龙主题:计算机视觉前沿论坛
时间:18:00-21:00
地点:图文中心3楼学习研讨区
主持人:阳诚砖 副教授
报告题目1:基于表示学习的多视图聚类算法研究
摘要:聚类分析是多视图数据挖掘的基础手段,目的是基于数据样本间的相似性将数据样本划分到相应类别。针对传统子空间聚类只使用欧几里得空间中的特征,以及核子空间聚类使用固定的核等问题,提出具有低秩核的多几何块对角表达子空间聚类。针对深度子空间聚类网络仅使用原始单个图像特征,及多视图子空间聚类产生的多个表达矩阵存在冗余性等问题,提出具有块对角和多样性表达的多视图子空间聚类网络。针对现有多视图聚类只考虑互补性或一致性等问题,提出基于互补性和一致性的大规模多视图聚类。
主讲人:刘茂山,浙江师范大学计算机科学与技术学院讲师。2023年6月从江南大学物联网工程学院毕业,获工学博士学位。2022年至2023年在国家留学基金委的资助下以联合培养博士生的身份赴英国考文垂大学学习。目前主要研究内容为大规模聚类算法,用于物体检测、物体分类、物体识别等下游视觉任务的开展。发表高水平SCI论文4篇。
合作需求:期待与计算机视觉,模式识别及机器学习等方向的学者一起合作。
报告题目2:基于深度学习的视觉目标跟踪
摘要:视觉目标跟踪是在仅提供视频序列中的初始状态情况下,估计出视频序列的每一帧中任意目标的状态。随着深度学习技术的发展,基于CNN或Transformer架构设计跟踪方法极大推动了跟踪领域的进步。本次报告内容主要围绕视觉目标跟踪算法的相关概述,包括其与多目标跟踪、视频目标分割的关联与区别;并进一步介绍目标跟踪的应用及其难点、现有的主流方法;最后,简要分享自身在目标跟踪方向上的几个研究工作。
主讲人:何雪东,中山大学博士,现浙江师范大学讲师、校聘副教授,研究方向为深度学习与计算机视觉,如视觉目标跟踪,视频目标分割,多目标跟踪,目标检测等。在国内外高水平期刊与会议上发表论文共14篇,其中SCI期刊论文共10篇(包括中科院TOP期刊论文6篇),以第一作者/通讯作者发表论文7篇;授权发明专利5项,其中3项第一发明人;参与一项国家自然科学基金面上项目。
合作需求:期待与对深度学习的技术应用和计算机视觉(跟踪、分割、检测等)感兴趣的老师或同学一起合作、交流。
报告题目3: Efficient robust watermarking based on structure-preserving quaternion singular value decomposition
摘要:Quaternion singular value decomposition (QSVD) is a robust technique of digital watermarking that extracts high quality watermarks from watermarked images with low distortion. However, the existing QSVD-based watermarking schemes face the obstacle of “explosion of complexity” and have much room for improvement in terms of real-time, invisibility, and robustness. In this paper, we overcome such obstacle by introducing a new real structure-preserving QSVD algorithm and propose a novel QSVD-based watermarking scheme with high efficiency. Secret information is transmitted blindly by incorporating two new strategies: coefficient pair selection and adaptive embedding. The highly correlated coefficient pairs determined by the normalized cross-correlation method reduce the impact of embedding by reducing the maximum modification of the coefficient values, resulting in high fidelity of the watermarked image. Large-size 8-color binary watermark and QR code effectively verify that the proposed watermarking scheme can resist various image attacks in numerical experiments. Two keys designed by Logistic chaotic map ensure the security of the watermarking system. Under the premise of considering the correlation of color channels, the proposed watermarking scheme not only performs well in real-time and invisibility, but also has satisfactory advantages in robustness compared with the state of-the-art methods.
主讲人: 陈勇,浙江师范大学计算机科学与技术学院讲师。2018年获得江苏师范大学理学硕士学位,2023年获得上海大学工学博士学位(导师:彭艳 教授)。主要从事数值代数和图像水印方面的工作,在TIP和 Signal Processing等国际期刊上发表论文4篇,参与国自然面上基金项目2项。
合作需求: 期待与数值代数,图像处理方面的学者交流、合作。