-
公开(公告)号:CN116306649B
公开(公告)日:2023-10-31
申请号:CN202310181570.4
申请日:2023-02-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/284 , G06F40/242
Abstract: 本发明提供一种词向量的生成方法、装置、电子设备及存储介质,该方法包括:获取至少一个目标词,所述目标词包括所述词典中的至少一个第一词汇,和/或,所述知识库中的至少一个头实体,所述知识库中包括至少两个用于表示知识的三元组数据;确定各所述目标词对应的至少一个释义词,所述释义词包括用于解释所述第一词汇的第二词汇,和/或,所述头实体对应的关系和尾实体;基于所述目标词和所述释义词,确定词向量矩阵,所述词向量矩阵的每一行表示一个词向量,所述词向量用于表征所述目标词或所述释义词的语义信息。本发明提供的词向量的生成方法、装置、电子设备及存储介质可以增强词向量的可解释性。
-
公开(公告)号:CN116187443A
公开(公告)日:2023-05-30
申请号:CN202310149607.5
申请日:2023-02-10
Applicant: 中国科学院自动化研究所
IPC: G06N5/022
Abstract: 本发明涉及数据处理技术领域,尤其涉及一种基于多维符号动力学的因果强度检测方法和检测装置。其中,因果强度检测方法包括,首先根据时间序列构建相空间中的吸引子,然后针对吸引子中的每个元素点,基于曼哈顿距离计算方法计算元素点的最近邻点,计算每个最近邻点对应的第一模式,对每个元素点的所有最近邻点的第一模式进行平均处理,得到每个元素点的平均模式,根据平均模式得到每个元素点的真实平均模式和预测平均模式,根据真实平均模式和预测平均模式计算因果强度值。依据本发明的因果强度检测方法可以提高因果强度值的检测效率。
-
公开(公告)号:CN110413787A
公开(公告)日:2019-11-05
申请号:CN201910687147.5
申请日:2019-07-26
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
Abstract: 本发明实施例公开了一种文本聚类方法、装置、终端和存储介质,其中,方法包括,获取媒体中的文本数据,并对文本数据进行标签分析处理,得到N个标签,根据N个标签中各个标签之间的相似度对N个标签进行聚类处理,得到M个标签集合,在检测到可视化事件时,显示M个标签集合中每一个标签集合对应的显示标识信息,通过实施上述方法,可以基于文本中标签的相似度对文本进行聚类,提升了对文本的聚类效率。
-
公开(公告)号:CN116306649A
公开(公告)日:2023-06-23
申请号:CN202310181570.4
申请日:2023-02-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/284 , G06F40/242
Abstract: 本发明提供一种词向量的生成方法、装置、电子设备及存储介质,该方法包括:获取至少一个目标词,所述目标词包括所述词典中的至少一个第一词汇,和/或,所述知识库中的至少一个头实体,所述知识库中包括至少两个用于表示知识的三元组数据;确定各所述目标词对应的至少一个释义词,所述释义词包括用于解释所述第一词汇的第二词汇,和/或,所述头实体对应的关系和尾实体;基于所述目标词和所述释义词,确定词向量矩阵,所述词向量矩阵的每一行表示一个词向量,所述词向量用于表征所述目标词或所述释义词的语义信息。本发明提供的词向量的生成方法、装置、电子设备及存储介质可以增强词向量的可解释性。
-
公开(公告)号:CN116187443B
公开(公告)日:2024-05-24
申请号:CN202310149607.5
申请日:2023-02-10
Applicant: 中国科学院自动化研究所
IPC: G06N5/022
Abstract: 本发明涉及数据处理技术领域,尤其涉及一种基于多维符号动力学的因果强度检测方法和检测装置。其中,因果强度检测方法包括,首先根据时间序列构建相空间中的吸引子,然后针对吸引子中的每个元素点,基于曼哈顿距离计算方法计算元素点的最近邻点,计算每个最近邻点对应的第一模式,对每个元素点的所有最近邻点的第一模式进行平均处理,得到每个元素点的平均模式,根据平均模式得到每个元素点的真实平均模式和预测平均模式,根据真实平均模式和预测平均模式计算因果强度值。依据本发明的因果强度检测方法可以提高因果强度值的检测效率。
-
公开(公告)号:CN110413787B
公开(公告)日:2023-07-21
申请号:CN201910687147.5
申请日:2019-07-26
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/35 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种文本聚类方法、装置、终端和存储介质,其中,方法包括,获取媒体中的文本数据,并对文本数据进行标签分析处理,得到N个标签,根据N个标签中各个标签之间的相似度对N个标签进行聚类处理,得到M个标签集合,在检测到可视化事件时,显示M个标签集合中每一个标签集合对应的显示标识信息,通过实施上述方法,可以基于文本中标签的相似度对文本进行聚类,提升了对文本的聚类效率。
-
-
-
-
-