一种基于语义模型的WSDL半结构化文档相似性分析及分类方法

    公开(公告)号:CN104063502B

    公开(公告)日:2017-03-22

    申请号:CN201410322692.1

    申请日:2014-07-08

    Applicant: 中南大学

    Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。

    一种推断lncRNA和疾病联系的方法

    公开(公告)号:CN106096331A

    公开(公告)日:2016-11-09

    申请号:CN201610406670.2

    申请日:2016-06-12

    Applicant: 中南大学

    CPC classification number: G06F19/18

    Abstract: 本发明公开了一种lncRNA和疾病联系的方法,根据多种异构数据(lncRNA‑疾病关系数据,蛋白质相互作用数据、lncRNA‑蛋白质相互作用数据等)构建一个全局异构网络,然后通过网络传播算法来识别可能的lncRNA和疾病的联系。本发明与现有的技术相比,除了考虑实验证实的lncRNA和疾病的联系外,还可以集成更多的生物数据,比如集成lnRNA‑蛋白质、蛋白质‑蛋白质相互作用和蛋白质‑疾病等之间联系。本发明通过融合更多的生物数据可以比以前的技术更准确的预测出lncRNA和疾病的联系,并且可以大规模的一次预测出多对lncRNA‑疾病之间的联系,有效的解决了生物实验方法的盲目性、成本高的问题。

    一种基于课程学习的文本实体识别方法

    公开(公告)号:CN114595691B

    公开(公告)日:2025-01-07

    申请号:CN202210210099.2

    申请日:2022-03-04

    Applicant: 中南大学

    Inventor: 石路云 张祖平

    Abstract: 本发明提供了一种基于课程学习的文本实体识别方法,包括将构建的文本标注数据集划分为训练集、验证集和测试集;将训练集中的文本数据按照从易到难的顺序进行排列,通过自然断点分类算法将排序后的训练集中的文本数据划分为n个区块;使实体识别模型对训练集中n个区块的文本数据进行课程学习,直至模型收敛;学习训练过程中将实体识别模型在验证集上进行评估,获取最优模型参数设置;将符合训练效果的实体识别模型应用于真实项目文本实体识别场景中。本发明通过使实体识别模型进行课程学习,训练时模型对局部极小值的跟踪会引导其走向更优的参数空间,更有可能逼近全局最小值,使其具有更好的泛化性,从而达到提升训练效率和识别准确度的效果。

    一种车辆轨迹的相似度计算方法、系统及存储介质

    公开(公告)号:CN111930791B

    公开(公告)日:2022-07-15

    申请号:CN202010470105.9

    申请日:2020-05-28

    Applicant: 中南大学

    Abstract: 本发明涉及数据挖掘分析技术领域,公开了一种车辆轨迹的相似度计算方法、系统及存储介质,该方法包括获取车辆的历史运行数据作为原始数据,根据原始数据得到车辆轨迹集;根据车辆轨迹集中的各车辆轨迹得到字符串,采用最小编辑距离方法判断任意两个字符串之间是否需要执行编辑操作,在需要进行编辑操作的情况下,计算编辑位置的连续轨迹编辑长度;根据连续轨迹编辑长度计算编辑位置的编辑代价;根据编辑位置的编辑代价计算总编辑代价,并根据总编辑代价得到两个字符串对应的车辆轨迹之间的相似度。克服了传统计算方法忽略轨迹点之间的距离、时间间隔、出现频次和产生的代价等因素的缺点,从而可以更高效、更准确地计算出两条车辆轨迹的相似性。

    一种基于半多模态融合特征约简框架的图像分类方法

    公开(公告)号:CN107944490B

    公开(公告)日:2020-11-27

    申请号:CN201711174750.0

    申请日:2017-11-22

    Applicant: 中南大学

    Inventor: 张祖平 曹坪 阳洁

    Abstract: 本发明公开了一种基于半多模态融合特征约简框架的图像分类方法,即通过保持来自脑功能和结构网络特征向量之间的关系,更好地捕捉多个模态数据的互补信息,使得疾病分类准确率进一步提升。本发明充分挖掘脑结构网络数据提供的参考信息,从脑功能网络特征向量矩阵中选择有效的特征数据,在已有K‑support范式的基础上增加新约束来保留不同模态特征数据的距离,分析与实验结果表明,本发明提出的基于半多模态融合特征约简框架框架优于已有的KSN和NF‑KSN方法。同时,本发明所选择出的一致性网络连接全面考虑了其在结构以及功能网络层面与疾病的相关性,而不只局限于功能网络层面,将选择出的一致性网络连接作为疾病生物标记的可信赖性更强。

    一种增强语义特征嵌入的文本表示方法

    公开(公告)号:CN109344403B

    公开(公告)日:2020-11-06

    申请号:CN201811101553.0

    申请日:2018-09-20

    Applicant: 中南大学

    Inventor: 张祖平 杨康

    Abstract: 本发明公开了一种增强语义特征嵌入的文本表示方法,包括以下步骤:S1、文本预处理;S2、对经预处理后的文本中的每个句子进行语义特征抽取,并根据所抽取的语义特征将文本中各个句子转化为相应的语义特征序列;将语义特征序列作为输入,利用词向量模型对语义特征序列进行训练,获得各个语义特征的向量模型;S3、将各个句子的绝对位置信息依次映射到同一个滑动窗口向量空间内,得到句子的位置向量模型;S4、将各个增强的特征向量模型进行融合,最终获得增强语义特征向量模型。本发明在自然语言处理任务中,如情感分析、文本摘要等,相比于现有的文本嵌入方法,应用增强语义特征的文本嵌入方法可以显著提高在这些任务上的表现。

    一种适用于透明计算系统的用户身份认证方法及系统配置方法

    公开(公告)号:CN106549976B

    公开(公告)日:2019-11-12

    申请号:CN201611130519.7

    申请日:2016-12-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种适用于透明计算系统的用户身份认证方法及系统配置方法,该认证方法包括当用户开机登录时,客户端发送登录请求信息给认证服务器,认证服务器查询后台数据库,获取用户可启动的操作系统权限列表并发送给客户端;用户选择操作系统,向存储服务器发起远程加载请求;存储服务器对客户端的用户名和密码进行认证,认证通过后查看用户操作系统镜像的配置文件,并根据客户端的IP与将要启动的操作系统镜像的IP设置判定认证成功与否。该系统配置方法用于配置使用该用户身份认证方法的透明计算系统。本发明实现了用户的权限管理,能提供一些个性化服务,完善了用户体验。

    基于KL距离相似性度量的研究热点演变行为检测方法

    公开(公告)号:CN109408782A

    公开(公告)日:2019-03-01

    申请号:CN201811216206.2

    申请日:2018-10-18

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于KL距离相似性度量的研究热点演变行为检测方法,其将刊物主题性和刊物的时序性相结合,提出了时序刊物主题模型TS-JTM,以实现学术刊物的时态热点抽取,在此基础上建立基于时间序列的主题快照刊物研究热点演变模型,同时,利用概率分布KL距离相似性度量方法,提出了度量相邻时刻主题快照中主题演变行为的检测方法,以实现对刊物中研究热点演变的细粒度分析。

    一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置

    公开(公告)号:CN105224695B

    公开(公告)日:2018-04-20

    申请号:CN201510770947.5

    申请日:2015-11-12

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置,根据特征词在文本文档内的词频和在不同文本类别上分布的信息熵来计算文档内各特征词的权重;同时可根据文本集各类别规模的非平衡性采用不同方式来计算特征词的类间分布熵,另外根据各特征词在文本集中的分布特点按需引入了反文档频率,而且适当缩减了局部词频因子,使得文档内各特征词的权重分配更合理,所生成的文档特征向量更充分地反映了不同类别文本的特征差异。所公开的文本特征量化装置和文本分类装置具备多个选项或参数,通过调节可获得最优的文本分类效果。所述文本特征量化方法不仅提高了文本分类的准确率,而且在不同文本集上的性能比较稳定。

    一种基于学术关系网络的专家学术距离评估方法

    公开(公告)号:CN104933111B

    公开(公告)日:2018-01-12

    申请号:CN201510299330.X

    申请日:2015-06-03

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于学术关系网络的专家学术距离评估方法,包括如下步骤:第一步,提取学术社区结构特征、关系跳数结构特征、关系权重结构特征以及邻里重叠度结构特征;学术社区结构特征区分两人是否在同一学术社区;学术关系跳数结构特征表示两人直接相连或达到通过人物的个数;学术关系权重表示在学术关系网络里,人物到其他人物的权重值;邻里重叠度表示共同朋友的数量;第二步,使用变异系数的灰色关联算法来综合评估以上的四个学术距离结构特征,得到综合的学术距离值。这种方法计算简便,能有效评估出是否回避,能显著提高科技评价及评审的公平与准确性。

Patent Agency Ranking