贵大新闻网讯(计算机科学与技术学院 供稿)近日,贵州大学计算机科学与技术学院秦永彬教授团队在计算机科学领域国际顶级学术期刊Knowledge-Based Systems(IF=8.8,中科院一区TOP期刊,JCR一区)上发表了题为“Deep Document Clustering via Adaptive Hybrid Representation Learning”的学术论文。论文第一作者为计算机科学与技术学院2020级博士研究生任丽娜同学,通讯作者为秦永彬教授。
据悉,Knowledge-Based Systems是计算机科学领域的世界顶级期刊之一,在计算机科学领域具有很高影响力,主要发表人工智能、大数据等领域高质量研究成果。

近年来,随着深度学习在各领域的突破性进展,深度学习与文本聚类任务结合的深度文本聚类算法受到普遍关注,成为了一个研究热点。现有深度文本聚类方法虽然初步探讨了混合语义表示的学习,但是大多采用直接融合的方法学习关联文本的结构语义表示,忽略了文本内容语义表示的重要性以及关联文本语义表示中噪音语义表示的影响,导致重要语义表示学习不足。该论文受此启发提出了一种基于自适应混合语义表示学习的深度文本聚类模型(DCAHR),解决了混合语义表示联合优化的问题。设计了一种自适应表示增强网络(AREN),用于学习语义和结构表示的一致性信息,并利用其自适应学习相应的增强表示。DCAHR模型充分利用文本自身内容语义表示与关联文本语义表示的互补特点,有效降低了混合语义表示学习过程中语义表示缺失和噪音的影响,突破了原有深度文本聚类方法中混合语义表示学习的缺陷。
基于自适应混合语义表示学习的深度文本聚类模型图
自适应表示增强网络结构图
编辑:庞爱忠 尹梓熹
责编:李旭锋
编审:杨楠






