一种基于动态标签的实体关系抽取模型训练方法及系统

    公开(公告)号:CN115688789A

    公开(公告)日:2023-02-03

    申请号:CN202211433871.3

    申请日:2022-11-16

    Abstract: 本发明涉及一种基于动态标签的实体关系抽取模型训练方法及系统,属于数据处理技术领域,解决了现有技术中样本不均衡时关系抽取模型准确率低的问题。包括预处理历史质量问题分析报告,构建样本集,将样本集划分为训练集和测试集;构建PCNN模型,基于训练集训练PCNN模型,根据当前训练结果动态更新各训练样本对应的各关系类别标签值,直至训练结束,得到训练好的PCNN模型;基于测试集验证PCNN模型,当模型准确率小于阈值,根据验证结果更新各关系类别的样本权重,并根据更新后的各关系类别的样本权重扩充训练集,基于扩充后的训练集再次训练PCNN模型,直至模型准确率不小于阈值,得到优化的PCNN模型,作为实体关系抽取模型。实现了关系抽取模型的高准确率。

    一种基于图片曝光转化率预测模型的图片推荐方法

    公开(公告)号:CN115618035A

    公开(公告)日:2023-01-17

    申请号:CN202211260773.4

    申请日:2022-10-14

    Abstract: 本发明涉及一种基于图片曝光转化率预测模型的图片推荐方法,属于互联网图片电商搜索技术领域,解决了现有多目标优化方法效果不佳的问题。获取用户注册信息、用户输入的检索词、与检索词匹配的图片信息、用户历史点击图片信息、历史购买图片信息,形成训练样本集。建立图片的曝光转化率预测模型CTCVR并训练,根据损失函数进行反向传播直至收敛。利用模型对所有图片进行处理,得到每张图片的点击率CTR、CVR、CTCVR以及图文相关值IMR,选取IMR值大于阈值的图片,并将选的图片按照CTCVR值由大至小的顺序推荐给用户。实现了一个模型完成多任务多目标的预测,使多个任务目标之间相互促进和约束,提高了模型的泛化性能,解决了深度转化过程中的样本偏差和数据稀疏问题。

Patent Agency Ranking