-
公开(公告)号:CN111985215A
公开(公告)日:2020-11-24
申请号:CN202010841791.6
申请日:2020-08-19
IPC: G06F40/242 , G06F40/289 , G06F40/30 , G06F40/216
Abstract: 本申请公开了一种领域短语词典构建方法,包括:挖掘短语;构建领域词库;构建词典模型。挖掘短语包括:将原始数据进行预处理和分词,随后对分词结果采用相邻词频短语挖掘方法,提取出句子中所有可能出现的短语集合。构建领域词库,包括:使用TF-IDF算法训练短语集合得到带权重的词,再通过权重阈值将词划分为领域相关词和无关词。本申请的领域短语词典构建方法,运用统计词频和词语权重量化短语与领域相关性程度,将深度学习网络与构建领域词典方向相结合,显著提升了领域词典的健壮性,在消费品领域词典构建上有良好的表现,提升了消费品缺陷领域词典的构建效果,能够达到较高的正确率、召回率和F1值。
-
公开(公告)号:CN110147371A
公开(公告)日:2019-08-20
申请号:CN201910404982.3
申请日:2019-05-15
Applicant: 北京信息科技大学
IPC: G06F16/22 , G06F16/242
Abstract: 本发明涉及一种车辆识别代号管理方法,包括:按照用于VIN编码规则标准化存储的树状结构模型对数据进行存储备案,在需要时,通过VIN解析获取到车辆基本配置参数。本发明提供的车辆识别代号管理方法,提出了用于车辆识别代码存储的树状结构模型,能够实现车辆识别代码自动校验、车辆基础信息解析等功能,实现对VIN自动、准确的解析,最大程度地提高了缺陷汽车产品召回管理中车辆识别的准确性,将其应用于汽车产品缺陷信息采集中能够大大提高消费者提交汽车产品缺陷信息报告的准确性和有效性,同时能够为开展汽车产品缺陷技术调查中车型配置精准定位提供技术支撑,可以很好地满足实际应用的需要。
-