-
公开(公告)号:CN113065341A
公开(公告)日:2021-07-02
申请号:CN202110274415.8
申请日:2021-03-14
Applicant: 北京工业大学
IPC: G06F40/247 , G06F40/289 , G06F16/33 , G06K9/62 , G06N3/02
Abstract: 本发明提供一种环境类投诉举报文本自动标注和分类方法,属于文本特征提取与文本分类领域。本发明通过从大量无标签数据中提取出不同领域对应的特征触发词,构建出对应领域特征词典;利用词典和文本相似度计算可以对不同领域的文本进行自动标注,将无标签数据转化为有标签数据,并利用其对神经网络进行训练,得到合适的分类模型。相比于现有技术,本发明减少了由人工标注数据所引起的误差,节省人力与时间;避免了无监督学习方式带来的准确率低、模型复杂、算力要求高等问题;构建的分类模型具有较强的泛化能力,并且可以在模型部署上线后,不断进行升级与改进。
-
公开(公告)号:CN113065341B
公开(公告)日:2024-12-17
申请号:CN202110274415.8
申请日:2021-03-14
Applicant: 北京工业大学
IPC: G06F40/247 , G06F40/289 , G06F16/33 , G06F18/214 , G06F18/23 , G06N3/02
Abstract: 本发明提供一种环境类投诉举报文本自动标注和分类方法,属于文本特征提取与文本分类领域。本发明通过从大量无标签数据中提取出不同领域对应的特征触发词,构建出对应领域特征词典;利用词典和文本相似度计算可以对不同领域的文本进行自动标注,将无标签数据转化为有标签数据,并利用其对神经网络进行训练,得到合适的分类模型。相比于现有技术,本发明减少了由人工标注数据所引起的误差,节省人力与时间;避免了无监督学习方式带来的准确率低、模型复杂、算力要求高等问题;构建的分类模型具有较强的泛化能力,并且可以在模型部署上线后,不断进行升级与改进。
-
公开(公告)号:CN114625879A
公开(公告)日:2022-06-14
申请号:CN202210299111.1
申请日:2022-03-13
Applicant: 北京工业大学
Abstract: 基于自适应变分编码器的短文本聚类方法涉及文本聚类技术领域。首先,对短文本使用sentence‑Bert的方法进行文本表示;其次,使用自编码器将向量转化为低维特征向量,使用K‑means方法提取聚类中心;然后,使用聚类中心作为变分自编码器的期望均值对于输入向量进行预训练,转化为满足以聚类中心为期望均值的分布的特征向量;将特征向量根据K‑means算法构建分类器,通过分类后的分布对分类器与编码器的权重进行微调。最后根据微调后的编码器与分类器得到聚类结果。本发明能够很好的处理短文本聚类中的文本向量高维稀疏的问题,为短文本聚类提供了新的特征深度嵌入算法。
-
公开(公告)号:CN111346351A
公开(公告)日:2020-06-30
申请号:CN202010261876.7
申请日:2020-04-05
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于摩擦轮的捡乒乓球机器人及其自动捡乒乓球方法,所述捡乒乓球机器人包括行走机构、聚拢装置、捡球机构、储球机构、可拆卸电路板机构、可拆卸外壳机构、控制系统、地图建模系统、视觉系统。所述捡球机构包括摩擦轮、无刷电机、斜坡、电调构成。行走机构为四个麦克纳姆轮和一个底盘。储球机构由一个可拆卸的储球盒及其固定装置构成。本发明利用乒乓球聚拢装置将机器人行进路线上的乒乓球聚集到两只摩擦轮中间,利用转动方向相反的摩擦轮通过挤压乒乓球来给予乒乓球一个初速度,能够令乒乓球沿着斜面滚动从而进入乒乓球的收集装置。本发明能通过精巧的结构将地面上散落的乒乓球进行收集。
-
-
-