一种实体状态模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN114897182A

    公开(公告)日:2022-08-12

    申请号:CN202210507647.8

    申请日:2022-05-10

    Abstract: 本申请提供了一种实体状态模型的训练方法、装置、设备及存储介质。该方法包括:基于实体训练集内每一实体的公开经营数据,确定该实体的数值统计特征、关键词表示特征和文本摘要表示特征;对实体训练集内每一实体的数值统计特征、关键词表示特征和文本摘要表示特征进行拼接,得到对应的实体融合特征;利用实体训练集内每一实体的实体融合特征和实体状态标签,训练对应的实体状态预测模型。本申请利用各个实体的公开经营数据来实现实体状态预测模型的准确训练,在确保模型训练样本特征全面有效的基础上,进一步降低实体状态预测模型训练时的样本获取难度,确保实体状态预测模型训练时的样本便捷性,从而提高实体状态预测的高效准确性。

    一种用于拟合变量联合分布的分层采样树方法及装置

    公开(公告)号:CN114048861A

    公开(公告)日:2022-02-15

    申请号:CN202111012713.6

    申请日:2021-08-31

    Inventor: 林熙东 杨青

    Abstract: 本发明公开了一种用于拟合变量联合分布的分层采样树方法、装置、设备及介质,其中方法包括:获取样本数据集所有0‑1取值的特征变量,按照编号顺序对特征变量进行排列,创建初始节点结构;遍历样本数据集的样本,按照特征变量顺序检查该样本每个特征的取值,直至检查完样本数据集所有样本后生成初始分层采样树;对初始分层采样树进行节点修正,直至所有节点均被遍历,得到修正后的分层采样树;通过修正后的分层采样树每次生成一个样本,重复该采样过程,直至生成所需的样本个数,得到采样样本数据集。本发明能够在拟合阶段高效捕捉样本数据集中多个0‑1变量的联合分布信息,在后续推理阶段精确生成与目标样本集相同联合分布的模拟样本数据集。

Patent Agency Ranking