文本相似度确定方法、装置、设备及存储介质

    公开(公告)号:CN112149414B

    公开(公告)日:2023-06-23

    申请号:CN202011009879.8

    申请日:2020-09-23

    Abstract: 本申请公开了一种文本相似度确定方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取第一文本;确定第一文本中包含的要素词;对于N个要素种类中的目标要素种类,获取第一文本中属于目标要素种类的各个目标要素词与第二文本中属于目标要素种类的各个目标要素词之间的字词相似度;基于字词相似度,确定第一文本与第二文本在目标要素种类上的相似度;基于第一文本与第二文本在N个要素种类上的相似度,确定第一文本与第二文本之间的相似度。本申请实施例提供的技术方案,从要素词相似的角度确定不同文本在各个要素种类上的相似度,进而确定不同文本的相似度,提升了不同文本间相似度确定的准确性,扩大了适用范围。

    传染病趋势预测方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN116189913A

    公开(公告)日:2023-05-30

    申请号:CN202111421807.9

    申请日:2021-11-26

    Abstract: 本申请提供了一种基于人工智能的传染病趋势预测方法、装置、电子设备、计算机可读存储介质及计算机程序产品;涉及人工智能技术;方法包括:获取预测时期的环境特征,并获取预测时期针对传染病的搜索数据,其中,搜索数据包括针对传染病进行搜索的关键词;基于搜索数据进行特征提取处理,得到预测时期针对传染病的搜索特征;对预测时期的环境特征以及搜索特征进行多源融合处理,得到针对传染病的多源融合特征;对针对传染病的多源融合特征进行趋势预测处理,得到预测时期的传染病趋势。通过本申请,能够自动并准确地预测传染病趋势。

    核保方法、装置、设备以及存储介质

    公开(公告)号:CN115994829A

    公开(公告)日:2023-04-21

    申请号:CN202111223511.6

    申请日:2021-10-20

    Abstract: 本申请公开了一种核保方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在进行核保时,能够获取目标对象的相关信息,基于该相关信息来生成目标图网络,由于目标图网络包括多个与该目标对象相关的节点,那么目标图网络也就能够完整的反映目标对象的情况,通过对目标图网络进行处理就能够得到目标对象的核保结果,核保过程无需人工参与,减少了耗费的人力和物力,降低了核保成本。

    构建传染病趋势预测模型的方法、预测方法、装置及设备

    公开(公告)号:CN111524611B

    公开(公告)日:2023-03-03

    申请号:CN202010334815.9

    申请日:2020-04-24

    Abstract: 本发明提供了一种构建传染病趋势预测模型的方法、疫情趋势预测方法、装置、电子设备及计算机可读存储介质;方法包括:将传染病的基本传染数根据传播时间进行衰减,得到处于传播期间的多个日期的有效传染数;在传染病趋势预测模型包括的状态转换关系中,确定与多个日期的有效传染数一一对应的多个日期的拟合状态数据;从多个日期的拟合状态数据中提取出多个日期的拟合病例数据;根据多个日期的真实病例数据与多个日期的拟合病例数据之间的差异,更新传染病趋势预测模型的参数,并将更新后的参数作为基于传染病趋势预测模型预测传染病疫情趋势时使用的参数。通过本发明,能够结合传染病数据精确建模,以支持基于传染病趋势预测模型的疫情趋势预测。

    标准文本的确定方法、装置、电子设备及存储介质

    公开(公告)号:CN115146612A

    公开(公告)日:2022-10-04

    申请号:CN202210551381.7

    申请日:2022-05-18

    Inventor: 林镇溪 张子恒

    Abstract: 本申请公开了一种标准文本的确定方法、装置、电子设备及存储介质,属于文本处理技术领域。方法包括:获取多个候选标准文本和原始文本;将原始文本拆分成至少两个第一文本段;对于任一个候选标准文本,将任一个候选标准文本拆分成至少两个第二文本段,根据至少两个第一文本段和至少两个第二文本段,确定原始文本和任一个候选标准文本之间的相关性;根据原始文本和各个候选标准文本之间的相关性,从多个候选标准文本中确定原始文本对应的目标标准文本。本申请从文本段的角度来细粒度地确定原始文本和候选标准文本之间的相关性,提高了相关性的准确性,从而提高了目标标准文本的准确性。

    内容检测方法、装置和计算机可读存储介质

    公开(公告)号:CN114461987A

    公开(公告)日:2022-05-10

    申请号:CN202210060921.1

    申请日:2022-01-19

    Abstract: 本申请实施例公开了一种内容检测方法、装置和计算机可读存储介质,涉及互联网技术领域;通过获取待检测内容和源内容集合,源内容集合包括至少一个具有版权的源内容;对待检测内容进行多模态特征提取,得到每一模态的待检测模态特征,并对源内容进行多模态特征提取,得到每一模态的源模态特征;计算待检测模态特征与对应模态的源模态特征的相似度,得到每一模态的模态相似度;根据待检测模态特征,确定每一模态的模态权重,并基于模态权重对模态相似度进行加权;基于加权后模态相似度,在源内容集合中检测出待检测内容的版权信息。通过确定每一模态的模态权重对待检测内容的模态相似度进行加权,提高内容检测的准确性,进而提高内容检测效率。

    术语处理方法、装置、设备及存储介质、程序产品

    公开(公告)号:CN114330309A

    公开(公告)日:2022-04-12

    申请号:CN202111666306.7

    申请日:2021-12-31

    Abstract: 本申请提供了一种术语处理方法、装置、设备及计算机可读存储介质;方法包括:获取特定领域的输入词;构建与输入词对应的第一术语运算树;基于第一术语运算树、以及针对特定领域的术语标准表中每个标准词预先构建的第二术语运算树,对术语标准表进行召回处理,得到与输入词对应的多个候选标准词;确定第一术语运算树分别与每个候选标准词对应的第二术语运算树之间的树相似度,将多个候选标准词按照树相似度进行降序排序,将降序排序结果中位于头部的部分候选标准词确定为待查标准词;对每个待查标准词的组成进行筛查处理,将得到的符合合理性指标的待查标准词确定为与输入词匹配的标准词。通过本申请,能够有效提高匹配标准词的准确性。

    文本标准化模型的训练方法、文本标准化方法及装置

    公开(公告)号:CN114328948A

    公开(公告)日:2022-04-12

    申请号:CN202111406902.1

    申请日:2021-11-24

    Inventor: 张子恒

    Abstract: 本申请提供了一种文本标准化模型的训练方法、文本标准化方法及装置,属于人工智能技术领域。所述方法包括:获取标准词汇集,所述标准词汇集包括多个标准词汇;基于所述标准词汇集中各标准词汇之间的相似程度,确定多个样本三元组,所述样本三元组包括中心样本词汇以及所述中心样本词汇关联的正样本词汇和负样本词汇;基于所述多个样本三元组,对文本标准化模型进行训练,所述文本标准化模型用于确定输入词汇之间的相似程度。上述技术方案,通过在训练模型时使用标准词汇集,使得不需要使用人工标注数据即可进行模型训练,从而实现了训练数据与细分领域下的人工标注数据的解耦,降低了训练成本,且具有广泛的适用性不受领域的局限。

    同义词挖掘、问答方法、装置、计算机设备和存储介质

    公开(公告)号:CN113761151A

    公开(公告)日:2021-12-07

    申请号:CN202110496948.0

    申请日:2021-05-07

    Inventor: 张子恒 陈曦

    Abstract: 本申请涉及一种同义词挖掘方法、装置、计算机设备和存储介质。所述方法包括:获取待挖掘词和候选基础同义词集;计算待挖掘词与基础同义词的编辑距离,并计算基础同义词之间的编辑距离,得到各个词距离特征;将待挖掘词和基础同义词分别进行向量化,得到各个词向量特征,提取待挖掘词和基础同义词的知识表征,得到各个词知识特征;将待挖掘词和基础同义词对应的词距离特征、词向量特征和词知识特征进行融合,得到词目标特征;基于待挖掘词对应的词目标特征和基础同义词对应的词目标特征计算待挖掘词与候选基础同义词集的同义程度;基于同义程度确定目标基础同义词集,将待挖掘词新增至目标基础同义词集。采用本方法能够提高同义词挖掘的准确性。

    一种实体对象编码方法、装置、电子设备和存储介质

    公开(公告)号:CN113609233A

    公开(公告)日:2021-11-05

    申请号:CN202110144797.2

    申请日:2021-02-02

    Abstract: 本申请涉及计算机技术领域,尤其涉及一种实体对象编码方法、装置、电子设备和存储介质,用以提高实体对象编码的准确性。其中,方法包括:获取待编码知识图谱中的各个实体对象;分别对各个实体对象进行编码,获得对应的实体嵌入特征,以及分别对各个实体对象的实体类别进行编码,获得对应的类别嵌入特征,其中,各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的;分别将各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合,获得各个实体对象对应的实体编码信息。本申请借助用于表示实体类别的本体知识,为数据量较少的实体对象进行指导,从而克服其误差,提升实体对象的编码质量,提高实体对象编码的准确度。

Patent Agency Ranking