-
公开(公告)号:CN102831606B
公开(公告)日:2014-10-22
申请号:CN201210272187.1
申请日:2012-08-01
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明提供了一种在医学影像中获取发音器官轮廓的方法。该方法包括:对于医学图像,利用唇部与背景的自动分割阈值,对医学影像中嘴唇与背景区域进行二值化,得到唇部轮廓;在唇部轮廓包含的面部范围内,提取上牙齿轮廓、下牙齿轮廓、上颌轮廓和下颌轮廓;针对上颌轮廓和下颌轮廓之间图像区域,获取舌位轮廓的可靠边缘点;以及由舌位轮廓的可靠边缘点拟合出舌位边缘轮廓。本发明能自动从影像背景中分割出发音人头部、器官区域,整个过程自动完成,无需人工交互。
-
公开(公告)号:CN114298053A
公开(公告)日:2022-04-08
申请号:CN202210230832.7
申请日:2022-03-10
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于特征和注意力机制融合的事件联合抽取系统,包括:输入层、特征提取层、触发词和论元识别层和事件后处理层;将预训练层输出的信息结合词性和位置信息输入到BiGRU和CNN中,得到句子的上下文语义特征矩阵和局部特征矩阵,再利用注意力机制融合这两种特征,最后将三种表示联合起来进行事件抽取;词嵌入层使用预训练模型BioBERT,并对其进行微调,以提高模型的效果;事件联合抽取,避免了级联错误的产生,提升模型的效果。
-
公开(公告)号:CN114168804A
公开(公告)日:2022-03-11
申请号:CN202111550920.7
申请日:2021-12-17
Applicant: 中国科学院自动化研究所
IPC: G06F16/901 , G06F16/903 , G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于异质子图神经网络的相似信息检索方法和系统。其中,方法包括:首先,将业务场景数据面向异质图进行图结构化数据,即构建异质图;其次,设计了一种子图范式,据此设计异质子图神经网络,建模和学习中心节点的邻域信息,并在不需要交互记录等标签的低资源情况下进行模型训练,从而得到节点的嵌入表示;最后,设计了基于局部敏感哈希的快速相似度计算模块来实现对相似内容检索这一功能的在线服务。本发明能够解决了低资源场景下相似信息检索这一业务需求。
-
公开(公告)号:CN113283605B
公开(公告)日:2021-11-09
申请号:CN202110841128.0
申请日:2021-07-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于预训练模型的交叉聚焦损失的溯因推理方法,包括:将观测对O1和O2与所有假设的结合,得到输入序列;将输入序列中的单一输入变量输入预训练模型,得到对应句子级别的特征矩阵,然后对特征矩阵的单词维度求和,得到特征向量;遍历输入序列中所有单一输入变量,得到特征向量序列;将特征向量序列输入双向长短期记忆网络,获取到分布式特征表示,再利用全连接层进行映射求和得到每个输入的分数;将输入序列中N个标签为真的值分别与所有标签为假的值组成N组,并进行组内softmax,得到交叉预测值;引入聚类因子和引入权重因子,改进FocalLoss,得到训练损失函数;优化所述训练损失函数,得到最优的溯因推理模型。
-
公开(公告)号:CN113254670A
公开(公告)日:2021-08-13
申请号:CN202110665550.5
申请日:2021-06-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于力导向的知识图谱可视化方法,包括:知识图谱数据提取包括:知识图谱构建和知识图谱查询;构造图数据结构:对构建好的知识图谱查询得到的相关的节点和关系进行图数据结构格式转换;力导向算法布局:随机初始化所有节点在屏幕中的坐标;把节点作为电子,使节点彼此之间存在斥力;把关系作为弹簧,使节点彼此之间存在引力;在斥力和引力的作用下迭代n次,最终达到平衡状态,得到所有节点的稳定坐标;可视化呈现:根据所有节点的稳定坐标,分别绘制节点以及节点之间的连线,得到最终知识图谱;运算流程可视化交互:通过最终知识图谱,为每个节点和关系绑定监听事件,使用户能通过鼠标操作节点和关系。
-
公开(公告)号:CN113051404A
公开(公告)日:2021-06-29
申请号:CN202110024807.9
申请日:2021-01-08
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06F16/2455
Abstract: 本申请实施例涉及数据处理技术领域,具体涉及一种基于张量分解的知识推理方法、装置、设备,旨在提高时序知识推理任务的准确率。所述方法包括:对时序知识图谱数据集中的数据进行提取,得到多组四元组数据,多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间;对多组四元组数据进行标注及处理,将处理好的四元组数据作为训练材料;将训练材料输入基于张量分解的时序知识推理模型及其变体模型中,利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练,得到训练好的时序知识推理模型及其变体模型;使用训练好的时序知识推理模型及其变体模型分别执行预测任务,推理问题的答案,得到最终的推理结果。
-
公开(公告)号:CN114297394B
公开(公告)日:2022-07-01
申请号:CN202210238820.9
申请日:2022-03-11
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种对文本中的事件论元进行抽取的方法和电子设备,该方法包括:对待处理文本中包含的事件类型进行检测,得到目标事件类型;根据该目标事件类型及对应的目标论元角色的先验关联信息,构造得到论元抽取问题;将待处理文本和论元抽取问题进行拼接,得到目标文本;将该目标文本的表示向量输入至机器阅读理解模型中,该模型包括两层依序设置的分类器,第一层分类器同步对该目标文本是否存在答案、对答案的开始位置和结束位置进行识别预测,得到携带有答案指示标签的位置预测结果;第二层分类器对开始位置和结束位置进行配对组合后的预测实体是否为事件论元进行预测,得到答案预测结果;根据该答案预测结果和对应的标签,输出事件论元。
-
公开(公告)号:CN114298053B
公开(公告)日:2022-05-24
申请号:CN202210230832.7
申请日:2022-03-10
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于特征和注意力机制融合的事件联合抽取系统,包括:输入层、特征提取层、触发词和论元识别层和事件后处理层;将预训练层输出的信息结合词性和位置信息输入到BiGRU和CNN中,得到句子的上下文语义特征矩阵和局部特征矩阵,再利用注意力机制融合这两种特征,最后将三种表示联合起来进行事件抽取;词嵌入层使用预训练模型BioBERT,并对其进行微调,以提高模型的效果;事件联合抽取,避免了级联错误的产生,提升模型的效果。
-
公开(公告)号:CN113377930B
公开(公告)日:2021-11-30
申请号:CN202110931275.7
申请日:2021-08-13
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/36 , G06F40/216 , G06F40/242 , G06F40/295
Abstract: 本发明提供面向中文短文本的实体识别与实体链接方法,包括:使用知识库中的实体名称与实体别名信息去构建实体名称词典并识别出实体;将实体的描述文本输入到预训练语言模型中,得到实体的名称嵌入表示;将所述识别出的实体在原始短文本中的位置特征、原始短文本和所述实体的名称嵌入表示同时输入到融合知识库实体名嵌入的短文本实体识别模型中,得到当前实体是否为正确实体的概率;再与传统的实体识别模型融合,得到最终实体识别结果;利用给定的知识库构建实体指称项词典,并通过实体识别结果确定每一个待消歧实体的候选实体集合;将原始短文本和待消歧实体的描述文本连在一起,输入实体链接模型,得到正确的链接实体。
-
公开(公告)号:CN113283605A
公开(公告)日:2021-08-20
申请号:CN202110841128.0
申请日:2021-07-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于预训练模型的交叉聚焦损失的溯因推理方法,包括:将观测对O1和O2与所有假设的结合,得到输入序列;将输入序列中的单一输入变量输入预训练模型,得到对应句子级别的特征矩阵,然后对特征矩阵的单词维度求和,得到特征向量;遍历输入序列中所有单一输入变量,得到特征向量序列;将特征向量序列输入双向长短期记忆网络,获取到分布式特征表示,再利用全连接层进行映射求和得到每个输入的分数;将输入序列中N个标签为真的值分别与所有标签为假的值组成N组,并进行组内softmax,得到交叉预测值;引入聚类因子和引入权重因子,改进FocalLoss,得到训练损失函数;优化所述训练损失函数,得到最优的溯因推理模型。
-
-
-
-
-
-
-
-
-