-
公开(公告)号:CN116955718A
公开(公告)日:2023-10-27
申请号:CN202310929844.3
申请日:2023-07-27
Applicant: 中国中医科学院中医药信息研究所 , 中央民族大学
IPC: G06F16/901 , G06F16/9536 , G06F16/9535 , G06F18/25
Abstract: 本发明公开了一种基于图论和大数据的中医药学者学术影响力评价模型,包括数据预处理模块,所述数据预处理模块的下一阶段为构建学术影响力网络模块,所述构建学术影响力网络模块的下一阶段为优化和应用PageRank算法模块,所述优化和应用PageRank算法模块的下一阶段为优化和应用HITS算法模块,本技术通过融合多源数据,对各种类型和形式的数据进行有效整合。该技术不仅处理来自传统学术数据库的数据,如学者的发表论文数量、被引用次数、合作关系等,而且还能处理来自新兴的社交媒体的数据,如学者的社交媒体关注者数量、点赞次数等。这种多源数据融合的能力,使我们可以从更多的角度和维度来评估学者的学术影响力,从而使评价结果更加全面和准确。
-
公开(公告)号:CN117235245A
公开(公告)日:2023-12-15
申请号:CN202311110718.1
申请日:2023-08-31
Applicant: 中国中医科学院中医药信息研究所 , 中央民族大学
IPC: G06F16/335 , G06F16/35 , G06F16/36
Abstract: 本发明公开了一种基于学术水平和研究主题的合作者推荐方法,方法步骤包括构建自顶向下的中医药领域学者知识图谱,针对中医药领域学者信息,我们首先构建了学者间信息与关系的知识图谱,同时考虑学者的学术能力对合作达成的影响,因此引入了学术迹指标等对学者按照学术能力进行聚类划分,在相同水平簇中进行后续的推荐,然后根据研究主题相似度分别进行了相似主题与跨主题的合作者推荐,为学者在相似主题和跨主题中寻找合作者提供了方法。通过实验分析,在相似主题合作者推荐下,我们的推荐模型在推荐人数为5时,准确率、召回率与F1值的综合评分表现更好,可解释性更强,能够为学者提供更加全面准确的合作者推荐结果。
-
公开(公告)号:CN118038849A
公开(公告)日:2024-05-14
申请号:CN202410179835.1
申请日:2024-02-18
Applicant: 中央民族大学
IPC: G10L13/08 , G10L13/04 , G10L13/033 , G10L25/30 , G10L25/18
Abstract: 本发明公开了一种基于Transformer的个性化藏语语音合成方法及系统,属于语音合成技术领域,该方法包括:获取不同藏语文本,得到拉丁字母文本集;获取不同的音频数据,得到语音梅尔频谱图集;将GST中的reference encoder和注意力机制模块引入Transformer模型,构建藏语语音合成模型,将所述拉丁字母文本集以及所述语音梅尔频谱图集输入到所述藏语语音合成模型进行训练,得到训练好的藏语语音合成模型;将一段待合成的语音及文本作为训练好的藏语语音合成模型的输入,输出一段与待合成的语音音色相似度较高,与对应文本匹配度高的语音梅尔谱。
-
公开(公告)号:CN109040407A
公开(公告)日:2018-12-18
申请号:CN201810779683.3
申请日:2018-07-16
Applicant: 中央民族大学
Abstract: 本申请公开了一种基于移动终端的语音采集方法及装置。该方法包括:接收用户的文件选择指令,向用户展示对应的第一文字信息;接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作;采用接收用户的文件选择指令,向用户展示对应的第一文字信息的方式,通过接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作,达到了准确、高效采集语音的目的,进而解决了相关技术中语音采集效率低下的问题。
-
公开(公告)号:CN113837186A
公开(公告)日:2021-12-24
申请号:CN202111427357.4
申请日:2021-11-29
Applicant: 中央民族大学
Abstract: 本公开是关于一种基于卷积神经网络的东巴象形文字识别方法及装置。基于卷积神经网络的东巴象形文字识别方法包括:获取待识别图像,待识别图像中包括东巴象形文字;基于深度残差网络模型对待识别图像进行特征识别,得到东巴象形文字对应的文字释义,深度残差网络模型包括至少一个残差跳跃连接结构,残差跳跃连接结构包括多个相邻堆叠的卷积层。通过本公开实施例,能够提高东巴象形文字识别的准确率。
-
公开(公告)号:CN107808661A
公开(公告)日:2018-03-16
申请号:CN201710995917.3
申请日:2017-10-23
Applicant: 中央民族大学
CPC classification number: G10L15/063 , G06K9/6256 , G06K9/6267 , G06N7/005 , G10L15/144 , G10L2015/0631
Abstract: 本发明公开了一种基于协作式批量主动学习的藏语语音语料标注方法及系统,其中系统包括:样本选择模块,手工标注模块,标注决策模块,标注者评估模块,训练集生成模块。本发明通过临近最优批量样本选择方法解决样本评价函数的构造及其submodular函数性质的证明,通过标注委员会协作标注方法,解决标注决策函数的构造、标注者评估模型和标注者辅助学习模型的建模。此外,本发明的系统能够实现样本的优化选择、用户的标注评估、标注信息和藏语语音知识的共享、标注者辅助学习等功能,拟提高藏语语音数据的标注质量,加快语音语料建设。
-
公开(公告)号:CN118098435B
公开(公告)日:2024-09-20
申请号:CN202410155879.0
申请日:2024-02-04
Applicant: 中央民族大学 , 中国中医科学院中药研究所
Abstract: 本发明公开了一种用于药物功效预测的方法及系统,涉及中医药领域,该方法包括:构建药材‑功效异构网络图;基于构建的药材‑功效异构网络图,通过Metapath2vec算法进行基于元路径的随机游走,并生成节点游走序列;进行模型训练,通过Word2vec模型学习药材和功效之间的语义关系信息;预测与分析。本发明通过使用Metapath2vec算法,可以有效地从大量数据中学习中药材的功效信息;本发明通过计算药材节点和功效节点的向量表示的相似度,可以预测新药物或新药方的功效;本发明可以辅助中医进行药材和药性的功效理解,助力中医进行处方药材的选择和新药方的研究;本发明极大地助力了新药方的研发和效率。
-
公开(公告)号:CN118038849B
公开(公告)日:2024-08-16
申请号:CN202410179835.1
申请日:2024-02-18
Applicant: 中央民族大学
IPC: G10L13/08 , G10L13/04 , G10L13/033 , G10L25/30 , G10L25/18
Abstract: 本发明公开了一种基于Transformer的个性化藏语语音合成方法及系统,属于语音合成技术领域,该方法包括:获取不同藏语文本,得到拉丁字母文本集;获取不同的音频数据,得到语音梅尔频谱图集;将GST中的reference encoder和注意力机制模块引入Transformer模型,构建藏语语音合成模型,将所述拉丁字母文本集以及所述语音梅尔频谱图集输入到所述藏语语音合成模型进行训练,得到训练好的藏语语音合成模型;将一段待合成的语音及文本作为训练好的藏语语音合成模型的输入,输出一段与待合成的语音音色相似度较高,与对应文本匹配度高的语音梅尔谱。
-
公开(公告)号:CN118098435A
公开(公告)日:2024-05-28
申请号:CN202410155879.0
申请日:2024-02-04
Applicant: 中央民族大学 , 中国中医科学院中药研究所
Abstract: 本发明公开了一种用于药物功效预测的方法及系统,涉及中医药领域,该方法包括:构建药材‑功效异构网络图;基于构建的药材‑功效异构网络图,通过Metapath2vec算法进行基于元路径的随机游走,并生成节点游走序列;进行模型训练,通过Word2vec模型学习药材和功效之间的语义关系信息;预测与分析。本发明通过使用Metapath2vec算法,可以有效地从大量数据中学习中药材的功效信息;本发明通过计算药材节点和功效节点的向量表示的相似度,可以预测新药物或新药方的功效;本发明可以辅助中医进行药材和药性的功效理解,助力中医进行处方药材的选择和新药方的研究;本发明极大地助力了新药方的研发和效率。
-
公开(公告)号:CN117690438A
公开(公告)日:2024-03-12
申请号:CN202311705086.3
申请日:2023-12-13
Applicant: 中央民族大学
IPC: G10L15/26 , G06N3/0455 , G06N3/08 , G06F40/40 , G10L15/16
Abstract: 一种基于最优运输方法的跨模态表示方法,涉及语音翻译方法领域,主要包括以下步骤:构建多任务通用框架的最优运输模型;采用最优运输方法实现跨模态表示,包括定义离散概率分布、利用最优运输模型找到运输成本最低的运输计划、利用运输成本最低的运输计划找到两个离散概率分布之间的最优传输方案和训练损失函数。本发明在模型输入端缩小了语音和文本之间的模态差异,能够更准确地捕捉语音信号和文本之间的对应关系。通过缩小模态差异并提高关联性,本发明的方法能够在语音翻译任务中实现更高的性能。本发明注重处理语音翻译模型输入模态之间的差异,更适用于广泛的语音翻译任务,尤其是在标记数据有限的情况下,表现更为出色。
-
-
-
-
-
-
-
-
-