贵大新闻网讯(大数据与信息工程学院)近日,我校大数据与信息工程学院2022级数据科学与大数据技术专业本科生陈嘉睿以第一作者身份撰写的论文 Confidence-Enhanced Dual-Space Semantic Alignment for Partial Multi-View Incomplete Multi-Label Classification 被国际期刊Knowledge-based Systems收录。Knowledge-based Systems是计算机科学领域的权威期刊,被中国科学院分区列为一区TOP期刊,在学术界享有盛誉,该期刊主要关注基于知识和其他人工智能技术的系统研究。
陈嘉睿的主要研究方向包括多视图学习、多标签分类等。在这篇发表的论文中,他提出一种置信度增强的双空间语义对齐(CDSA)框架,该框架通过动态置信度加权机制(DCW)和基于标签的语义对齐(LSA)方法,平衡不同视图的信息质量差异,减少语义不一致性,旨在解决多视图多标签分类中视图缺失和标签不完整带来的挑战。
多视图多标签分类(MvMLC)作为一种结合多视图学习和多标签分类的技术,因其能够利用多个视角为样本分配多个标签而广泛受到研究者关注。然而,MvMLC在现实应用中经常面临视图和标签缺失的问题,这些问题往往来源于数据采集的不完整、传感器故障或人工标注成本高且耗时。尽管现有方法已经尝试解决这些问题,但它们在处理不同视图之间语义信息差异方面仍存在不足,特别是由于不同视图提供的信息可靠性和重要性存在差异。
为应对这些挑战,论文提出了一种信任度增强的双空间语义对齐(CDSA)框架。与以往依赖静态贡献分配的视图嵌入方法不同,CDSA框架引入了一种动态置信度加权机制(DCW),该机制通过任务特定的信任度估计量化每个视图相对于下游任务的可靠性,平衡不同视图之间的信息质量差异。此外,为进一步解决视图间的语义差异,论文提出了基于标签的语义对齐(LSA)方法,旨在最小化样本间语义结构的不一致性,从而保证语义结构的一致性并减少对齐问题。最终,陈嘉睿同学设计了一个双空间策略,包括原始空间和信任度映射空间,该策略能够在这两个空间中有效集成DCW和LSA,提升模型在缺失或低质量数据下的可靠性和性能。通过在五个基准数据集上的广泛实验,CDSA框架在处理不完整数据时表现出显著优于现有方法的效果,验证了其有效性。
陈嘉睿表示:“论文的顺利发表离不开学校提供的优越环境和资源,我特别感谢大数据与信息工程学院老师们的细心指导和同学们的支持与鼓励,尤其感谢卢晓寰老师在研究过程中给予的悉心指导与帮助,其专业知识和宝贵意见为我的研究工作提供了重要方向。同时,学院领导在我研究过程中的悉心教诲和大力支持,也为我的研究工作提供了动力。通过这次研究与论文写作的历程,我不仅提升了学术能力,还培养了坚韧的毅力和独立的思考能力,深刻认识到学术研究的严谨性与重要性。今后,我将以此为新的起点,继续努力,不断在学术领域探索与前行。”
编辑:张蝉 尹梓熹
责编:李旭锋
编审:丁龙