-
公开(公告)号:CN114510567A
公开(公告)日:2022-05-17
申请号:CN202111592178.6
申请日:2021-12-23
Applicant: 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请公开了一种基于聚类的新意图发现方法、装置、设备和存储介质,本申请先根据已知意图数据对分类器进行预训练,再通过优化后的轮廓系数选取聚类数,聚类效果较好,将已知意图数据和无标签数据结合训练分类器的模式,迭代时将上一轮的已知意图数据作为监督信号,不断地更新已知意图数据,直至没有增加新意图时,停止迭代,并输出发现新意图的对齐标签,充分利用了已知意图数据,增强了分类、聚类过程之间的信息交流,更有利于指导聚类过程并准确充分地发现新意图,从而解决了现有技术没有充分利用已知意图的数据,没有考虑新增意图和已知意图的区别,导致聚类效果不佳,难以准确充分地发现新意图的技术问题。