一种基于单文本词项凝固度的字典自动抽取方法与系统

    公开(公告)号:CN116644740A

    公开(公告)日:2023-08-25

    申请号:CN202310404243.0

    申请日:2023-04-17

    Applicant: 中南大学

    Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种基于单文本词项凝固度的字典自动抽取方法与系统,包括:输入说明子系统:用于录入输入数据,输入数据包括待分词文本和自定义断点数,根据待分词文本生成的候选词项会生成候选词项的凝固度,自然断点法说明子系统:用于分组候选词项的凝固度获得分组数据,通过对分组数据给定不同的级别来表示匹配时的优先级,构件字典过程说明子系统:用于基于候选词项的凝固度优先级和单文本自动构建词典,输出说明子系统:用作数据输出,数据输出为基于地质单文本和凝固度自动构建的字典,解决了传统的专业字典生成方法在设定规则、标注语料库、筛选词项时,存在大量人工耗费的问题。

    一种基于二自由度空间的注记最小和最大缓冲距离确定的方法

    公开(公告)号:CN116310155A

    公开(公告)日:2023-06-23

    申请号:CN202211491113.7

    申请日:2022-11-25

    Applicant: 中南大学

    Abstract: 本发明属于地图标注技术领域,公开了一种基于二自由度空间的注记最小和最大缓冲距离确定的方法,该方法通过将一个文本高度分成n段,取一个文本高度的1/n‑n/n作为缓冲距离的候选范围,将注记的最小缓冲距离设置为一个文本高度的1/n,最大缓冲距离以此设置为一个文本高度的2/n、3/n、4/n、......、n/n。本发明通过借鉴参考位置的N分法,将最小至最大缓冲距离的范围分成n段,计算不同缓冲距离下的理论极限值及变化情况,可以快速确定地图最优缓冲距离范围,能够提高注记自动配置的效率,也能在一定程度上减少注记压盖和注记歧义。

    一种基于二自由度空间的多要素地图注记优化DDEGA-NM算法及系统

    公开(公告)号:CN116303841A

    公开(公告)日:2023-06-23

    申请号:CN202211491090.X

    申请日:2022-11-25

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于二自由度空间的多要素地图注记优化DDEGA‑NM算法及系统,在已确定合适的候选位置数(N*M)以及最小和最大缓冲距离的前提下,改进DDEGA算法的初始种群生成和随机迭代过程,从而提高注记配置质量和算法收敛的速度,最后形成基于二自由度空间多候选位置注记配置的DDEGA优化算法,优化分为两步:第一步是优化初始种群,通过加入局部最优排列组合方式和控制初始种群随机产生的范围来提高初始种群的质量;第二步是优化遗传过程,改变差分算法和遗传算法生成新种群个体的比例,并增加一部分由高质量候选位置随机产生的个体。

    一种基于布局优化投票的图片文字识别方法、系统

    公开(公告)号:CN119068499A

    公开(公告)日:2024-12-03

    申请号:CN202411193571.1

    申请日:2024-08-28

    Applicant: 中南大学

    Abstract: 本发明涉及图片文字识别技术领域,具体公开了一种基于布局优化投票的图片文字识别方法、系统,包括以下步骤:步骤100,输入文本图像文件;步骤200,输入图像预处理;步骤300,图像文字布局调整;步骤400,多布局行图像文字识别及多布局识别结果投票;步骤500,输出结果列表,结束。本发明结合点阵汉字正方形的表示特点,以行高估算字符大小,并以字符大小来模拟字间距与行间距来调整文字布局,最后对多种文字布局识别结果进行投票,得到最后结果。

    一种基于云原生部署的模型管理与调度的方法、介质及系统

    公开(公告)号:CN118502970A

    公开(公告)日:2024-08-16

    申请号:CN202410962060.5

    申请日:2024-07-18

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于云原生部署的模型管理与调度的方法、介质及系统,模型管理方法包括模型封装步骤、模型资源描述步骤、模型应用集成步骤;模型调度方法包括模型应用流程解析与控制步骤、基于前置任务匹配的调度优化步骤、多维度异构资源感知的任务混合调度步骤。本发明采用分布式任务调度方法,实现模型粒度的任务能够派发到性能更好、资源匹配度更高的计算节点上执行,尤其适合大规模科学计算任务的执行。

    一种基于信息熵的单文本词项凝固度计算方法与系统

    公开(公告)号:CN116522923A

    公开(公告)日:2023-08-01

    申请号:CN202310404236.0

    申请日:2023-04-17

    Applicant: 中南大学

    Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种基于信息熵的单文本词项凝固度计算方法与系统,包括输入说明子系统:用于输入数据,输入数据包括单文本的输入及候选词项的信息熵的生成,以及根据数据格式[词项,左侧信息熵,右侧信息熵,词频,词长]进行二维表数据集的生成,主成分分析说明子系统:用于根据相关变量生成若干线性不相关的主成分,计算主成分的综合得分获得得分数据,主成分互不相关,相关变量由信息熵、词频、词长构成,输出说明子系统:用于组合排布得分数据来进行对单文本词项凝固度表的输出,解决了传统的分词技术在分词过程中,均需要使用到两个及以上的评价指标,没有统一的指标来进行对词项的直接对比和验证的问题。

    一种基于信息熵的领域单文本分词方法与系统

    公开(公告)号:CN116522922A

    公开(公告)日:2023-08-01

    申请号:CN202310404223.3

    申请日:2023-04-17

    Applicant: 中南大学

    Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种基于信息熵的领域单文本分词方法,包括:获取待分词文本;遍历文本,计算单字符信息熵,并选取停用字;遍历文本,枚举所有可能的字符串连接组合形成候选词项,并计算各个候选词项的左右信息熵,以生成并记录候选词集;通过候选词集进行分词:遍历候选词集,记录不包含停用字且与已记录的分词结果无冲突的候选词项为分词结果,当候选词项与已记录的分词结果冲突时,记录并更新更满足边界冲突消减算法的候选词项为分词结果;对分词结果进行二次遍历,若存在停用字与前后某一单字组合信息熵更高且不为零,合并停用字与该单字,得到最终分词结果。本发明针对领域单文本的分词效果优秀,准确率更高。

    一种地图要素注记多候选位置生成方法和装置

    公开(公告)号:CN115908637A

    公开(公告)日:2023-04-04

    申请号:CN202211491593.7

    申请日:2022-11-25

    Applicant: 中南大学

    Abstract: 本申请公开了一种地图要素注记多候选位置生成方法和装置,该方法包括:根据地图上的目标要素所在的位置,确定参考位置,其中,所述目标要素为需要添加注记的要素;根据所述参考位置和缓冲距离,确定候选区域,其中,所述缓冲距离为预设值,所述候选区域为所述地图上的部分区域;对所述候选区域进行划分;根据所述候选区域的划分结果,确定多个候选位置;确定多个所述候选位置中的一个所述候选位置为目标位置;将所述目标要素对应的注记配置在所述目标位置处。通过本申请解决了现有技术中对地图进行注记时所导致抑制注记配置质量的问题,从而提高了注记配置的质量。

Patent Agency Ranking