-
公开(公告)号:CN110909788B
公开(公告)日:2020-11-27
申请号:CN201911135825.3
申请日:2019-11-19
Applicant: 湖南博通信息股份有限公司 , 中南大学
Abstract: 本发明提供一种基于统计聚类的轨迹数据中道路交叉口位置识别方法,包括轨迹数据坐标投影转换、轨迹数据化简处理;针对化简后轨迹数据,采用多核并行计算方式,根据采样点转向变化识别道路交叉口区域内的采样点,构成转向采样点集合;以转向采样点集合为输入,利用自适应统计聚类算法进行自动划分聚类,将不同位置的道路交叉口进行剥离;最后,针对每个转向采样点聚类,通过最小外接圆拟合算法计算覆盖该聚类的最小外接圆的中心位置和半径,以最小外接圆的中心和半径表示该道路交叉口的中心位置和区域范围。
-
公开(公告)号:CN110909788A
公开(公告)日:2020-03-24
申请号:CN201911135825.3
申请日:2019-11-19
Applicant: 湖南博通信息股份有限公司 , 中南大学
Abstract: 本发明提供一种基于统计聚类的轨迹数据中道路交叉口位置识别方法,包括轨迹数据坐标投影转换、轨迹数据化简处理;针对化简后轨迹数据,采用多核并行计算方式,根据采样点转向变化识别道路交叉口区域内的采样点,构成转向采样点集合;以转向采样点集合为输入,利用自适应统计聚类算法进行自动划分聚类,将不同位置的道路交叉口进行剥离;最后,针对每个转向采样点聚类,通过最小外接圆拟合算法计算覆盖该聚类的最小外接圆的中心位置和半径,以最小外接圆的中心和半径表示该道路交叉口的中心位置和区域范围。
-
公开(公告)号:CN119129600B
公开(公告)日:2025-02-18
申请号:CN202411603699.0
申请日:2024-11-12
Applicant: 中南大学
IPC: G06F40/295 , G06F40/237 , G06F40/284 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/0895
Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于空间关系感知的地名实体识别方法、介质和设备,所述方法包括如下步骤:通过网络中地名实体的自然语言句子以及处理地理数据集构造的伪句子构建语料库,利用伪句子和自然语言句子,采用对比学习和掩码语言建模学习进一步训练自然语言模型。本方法基于自然语言模型搭建一种中文命名实体识别模型:通过词向量转换学习字符级特征表示,自然语言模型学习词级特征表示,融合嵌入层整合字符级特征表示和词级特征表示生成新的特征表示,通过双向长短期记忆网络提取文本上下文语义特征,条件随机场获得全局最优的标签序列,实现地名实体识别。本发明方法提升了地名实体识别模型的整体性能。
-
公开(公告)号:CN118467793B
公开(公告)日:2024-09-24
申请号:CN202410923861.0
申请日:2024-07-11
Applicant: 中南大学
IPC: G06F16/901 , G06N3/042 , G06N3/044 , G06N3/0464 , G06N3/08 , G06Q50/00 , G06F16/903 , G06F16/9536 , G06F18/213 , G06F18/22 , G06F18/23
Abstract: 本发明涉及数据处理技术领域,具体公开了一种面向异质图的图匹配方法、设备及介质,本发明方法基于扩散模型和注意力机制计算图对的结构相似特征,并通过多层匹配网络进行对比学习,得到超边‑超边的匹配向量以及超边‑超图的匹配向量,基于超边‑超边的匹配向量以及超边‑超图的匹配向量得到生成语义相似特征;将结构相似特征和语义相似特征拼接,得到图对的全局对比特征向量,将全局对比特征向量输入全连接神经网络,得到用于反应图对相似程度的相似度得分。本发明方法结合语义与结构特征,融合图结构自身的相似特征以及节点与从属社区特征学习语义信息,本发明提出的异质图相似学习方法考虑更全面,又能有效准确的得到图对的相似度得分。
-
公开(公告)号:CN117131198B
公开(公告)日:2024-01-16
申请号:CN202311404157.6
申请日:2023-10-27
Applicant: 中南大学
Abstract: 本发明实施例中提供了用于医学教学库的知识增强实体关系联合抽取方法及设备,属于数据处理技术领域,具体包括:利用词表征得到初始跨度表征;得到实体及实体间关系并将其作为未注入外部知识前的第一实体关系预测结果;构造医学数据集的外部知识图;更新得到融合全局信息的节点表征;采用基于注意力的去噪融合机制,基于注意力的评分机制为跨度和节点打分,按照得分加权融合跨度表征和节点表征;得到实体及实体间关系并将其作为注入外部知识后的第二实体关系预测结果;结合监督信息联合训练实体关系抽取模型;使用实体关系抽取模型对多视角医学资料进行实体识别和关系分类,形成医学教学资源库。通过本发明的方案,提高了识别
-
公开(公告)号:CN118468996A
公开(公告)日:2024-08-09
申请号:CN202410942880.8
申请日:2024-07-15
Applicant: 中南大学
IPC: G06N5/02 , G16H15/00 , G06N3/0455 , G06N3/0895
Abstract: 本发明实施例中提供了一种基于医学影像报告的多模态教学知识图谱构建方法,属于数据处理技术领域,具体包括:得到文本实体和关系;得到视觉特征,得到文本特征;利用线性层将视觉和文本特征映射到相同维度的特征空间,将映射后的特征拼接并加入一个可学习的嵌入;根据影像报告跨模态实体对齐模型对于真实标签预测损失的梯度反馈进一步迭代解剖标签生成器的参数;通过对比学习训练影像报告跨模态实体对齐模型;将学习到的嵌入输入训练好的影像报告跨模态实体对齐模型的预测模块,标记出影像图片中文本实体对应的视觉实体区域;根据视觉实体区域、文本实体和关系构建多模态知识图谱。通过本发明的方案,提高了构建效率、精准度和泛化性能。
-
公开(公告)号:CN118194990B
公开(公告)日:2024-08-06
申请号:CN202410611960.5
申请日:2024-05-17
Applicant: 中南大学
Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种论文推荐方法、设备及介质,所述方法包括如下步骤:S1:训练学术预训练模型,得到映射网络,将外部知识库中文本数据传递到映射网络中,获取外部知识库的语义信息;S2:融合外部知识库的语义信息和时序知识图谱的动态演进信息,得到最终实体向量矩阵;S3:将最新时间戳知识图谱输入卷积网络中,得到实体的卷积向量,将卷积向量拼接成最终卷积输出,调用得分函数计算实体和关系之间的得分,基于最终实体向量矩阵和得分计算可能性向量,基于所述可能性向量完成论文推荐。优点是,本发明方法通过注入外部知识库的语义信息用来帮助模型完成推理,减少迭代次数,提高了论文推荐的准确率。
-
公开(公告)号:CN118194990A
公开(公告)日:2024-06-14
申请号:CN202410611960.5
申请日:2024-05-17
Applicant: 中南大学
Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种论文推荐方法、设备及介质,所述方法包括如下步骤:S1:训练学术预训练模型,得到映射网络,将外部知识库中文本数据传递到映射网络中,获取外部知识库的语义信息;S2:融合外部知识库的语义信息和时序知识图谱的动态演进信息,得到最终实体向量矩阵;S3:将最新时间戳知识图谱输入卷积网络中,得到实体的卷积向量,将卷积向量拼接成最终卷积输出,调用得分函数计算实体和关系之间的得分,基于最终实体向量矩阵和得分计算可能性向量,基于所述可能性向量完成论文推荐。优点是,本发明方法通过注入外部知识库的语义信息用来帮助模型完成推理,减少迭代次数,提高了论文推荐的准确率。
-
公开(公告)号:CN117708339B
公开(公告)日:2024-04-23
申请号:CN202410165651.X
申请日:2024-02-05
Applicant: 中南大学
IPC: G06F16/35 , G06F16/33 , G06N3/0455 , G06N3/0464 , G06N3/08 , G16H10/60
Abstract: 本发明实施例中提供了一种基于预训练语言模型的ICD自动编码方法,属于数据处理技术领域,具体包括:构建ICD自动编码数据集;形成映射集;构造前缀树,结合前缀树形成LEDT模型;将ICD自动编码数据集分为训练集和验证集;分别将训练集和验证集中的临床文本和其对应的ICD代码分割;利用seq2seq训练数据集训练LEDT模型;将待编码数据集中的输入文本输入目标模型,并在目标模型的解码生成过程中,使用前缀树对生成的字符进行限制,同时使用集束算法保留输出得分最高的k个预测描述,最终利用映射集将输出的k个预测描述转换为对应的ICD代码作为预测输出。通过本发明的方案,提高了编码效率、精准度和适应性。
-
公开(公告)号:CN117708339A
公开(公告)日:2024-03-15
申请号:CN202410165651.X
申请日:2024-02-05
Applicant: 中南大学
IPC: G06F16/35 , G06F16/33 , G06N3/0455 , G06N3/0464 , G06N3/08 , G16H10/60
Abstract: 本发明实施例中提供了一种基于预训练语言模型的ICD自动编码方法,属于数据处理技术领域,具体包括:构建ICD自动编码数据集;形成映射集;构造前缀树,结合前缀树形成LEDT模型;将ICD自动编码数据集分为训练集和验证集;分别将训练集和验证集中的临床文本和其对应的ICD代码分割;利用seq2seq训练数据集训练LEDT模型;将待编码数据集中的输入文本输入目标模型,并在目标模型的解码生成过程中,使用前缀树对生成的字符进行限制,同时使用集束算法保留输出得分最高的k个预测描述,最终利用映射集将输出的k个预测描述转换为对应的ICD代码作为预测输出。通过本发明的方案,提高了编码效率、精准度和适应性。
-
-
-
-
-
-
-
-
-