一种基于指针网络的命名实体联合识别方法及系统

    公开(公告)号:CN116127973A

    公开(公告)日:2023-05-16

    申请号:CN202211593392.8

    申请日:2022-12-13

    Abstract: 本发明公开了一种基于指针网络的命名实体联合识别方法及系统,该方法将文本分词后的字符整数索引和位置索引的向量和输入BERT模型得到融合上下文的向量和,将所述融合上下文的向量和输入序列解码模型和指针解码模型进行联合训练,得到实体概率分布、实体起点概率分布和实体终点概率分布;所述联合训练为:训练所述序列解码模型使其稳定后,联合训练所述序列解码模型和所述指针解码模型使其稳定,最后训练所述指针解码模型使其稳定;最后进行联合解码得到实体标签;本发明提出了基于BERT的CRF和指针网络的联合模型,通过多任务交替训练的策略得CRF和指针网络都得到充分训练,有效地降低NER任务中实体边界识别错误率,提高模型的泛化能力。

    一种基于机器学习的电话引流方法、系统及存储介质

    公开(公告)号:CN119892984A

    公开(公告)日:2025-04-25

    申请号:CN202510049291.1

    申请日:2025-01-13

    Abstract: 本发明公开了一种基于机器学习的电话引流方法、系统及存储介质,包括构建有害和正常号码的样本特征库;对样本特征库中的特征数据进行预处理,并划分为特征训练集和特征测试集;基于特征训练集,构建决策树;基于特征测试集,对决策树中的决策规则进行筛选,获得在测试集上表现最优的特征组合及特征组合对应的分割阈值;收集新批次呼叫号码,并获取呼叫号码的特征数据,基于最优特征组合及特征组合对应的分割阈值对呼叫号码的特征数据进行识别,从而预测出该呼叫号码是有害号码还是正常号码;定时更新最优特征组合及其对应的分割阈值,确保在有害号码特征发生变化时,同样能实现较好的引流效果。本发明利用机器学习算法对样本特征数据进行分类,并筛选出引流效果最好的特征组合和分割阈值,能够更准确地识别出有害电话,减少误判和漏判。

    基于QQ文本流量分析目标通联对端的系统及其方法

    公开(公告)号:CN112565060B

    公开(公告)日:2022-06-10

    申请号:CN202011399034.4

    申请日:2020-12-04

    Abstract: 本发明公开了基于QQ文本流量分析目标通联对端的系统及方法,属于数据挖掘技术领域,其方法包括:获取时间范围T内全网的QQ文本流量数据;针对每个发送流量di找到满足通联条件的所有接收流量作为di对应的候选通联流量集合Sdi;针对每个Sdi生成候选通联关系集合S;针对S根据发送端和接收端的QQ号码分组得到QQ号码之间的通联关系元组S’={qm,qn,Smn,Snm};遍历针对每一个通联关系元组,计算两个QQ号码qm和qn的文本通联权重w(qm,qn);遍历S’,将w(qm,qn)>wth的QQ号码qm和qn作为一组通联对象,保留Smn和Snm中的通联关系。该方法利用文本通联数据中的动作类型、时间、消息长度信息,挖掘出与每个QQ号码在时间维度和消息长度维度关联性高的QQ号码,得到更为准确的结果。

    一种基于大数据的人车关联分析系统及方法

    公开(公告)号:CN114490670B

    公开(公告)日:2024-07-12

    申请号:CN202210182777.9

    申请日:2022-02-25

    Abstract: 本发明公开了一种基于大数据的人车关联分析系统及方法,首先从时间维度进行时间切片,然后从空间上对车辆位置数据做一定范围的空间扩展,再从时间、空间两个维度对手机号、车牌号类型、车牌号做碰撞分析,得到带有关联次数的日表结果,最后进行聚合分析,取连续多天的日表结果,按照车牌号、手机号分组将关联次数累加,再以车牌号为关键词,将关联次数排序,保留关联次数前M的手机号,形成总表结果,通过大数据的筛查,实现人车双向关联分析,即从车辆的角度分析出经常驾驶的人,也能从人的角度分析出经常驾驶的车辆。

    一种基于大数据的人车关联分析系统及方法

    公开(公告)号:CN114490670A

    公开(公告)日:2022-05-13

    申请号:CN202210182777.9

    申请日:2022-02-25

    Abstract: 本发明公开了一种基于大数据的人车关联分析系统及方法,首先从时间维度进行时间切片,然后从空间上对车辆位置数据做一定范围的空间扩展,再从时间、空间两个维度对手机号、车牌号类型、车牌号做碰撞分析,得到带有关联次数的日表结果,最后进行聚合分析,取连续多天的日表结果,按照车牌号、手机号分组将关联次数累加,再以车牌号为关键词,将关联次数排序,保留关联次数前M的手机号,形成总表结果,通过大数据的筛查,实现人车双向关联分析,即从车辆的角度分析出经常驾驶的人,也能从人的角度分析出经常驾驶的车辆。

    基于QQ文本流量分析目标通联对端的系统及其方法

    公开(公告)号:CN112565060A

    公开(公告)日:2021-03-26

    申请号:CN202011399034.4

    申请日:2020-12-04

    Abstract: 本发明公开了基于QQ文本流量分析目标通联对端的系统及方法,属于数据挖掘技术领域,其方法包括:获取时间范围T内全网的QQ文本流量数据;针对每个发送流量di找到满足通联条件的所有接收流量作为di对应的候选通联流量集合Sdi;针对每个Sdi生成候选通联关系集合S;针对S根据发送端和接收端的QQ号码分组得到QQ号码之间的通联关系元组S’={qm,qn,Smn,Snm};遍历针对每一个通联关系元组,计算两个QQ号码qm和qn的文本通联权重w(qm,qn);遍历S’,将w(qm,qn)>wth的QQ号码qm和qn作为一组通联对象,保留Smn和Snm中的通联关系。该方法利用文本通联数据中的动作类型、时间、消息长度信息,挖掘出与每个QQ号码在时间维度和消息长度维度关联性高的QQ号码,得到更为准确的结果。

Patent Agency Ranking