一种基于知识蒸馏与变分自编码器的命名实体识别方法

    公开(公告)号:CN118395985A

    公开(公告)日:2024-07-26

    申请号:CN202410866352.9

    申请日:2024-07-01

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于知识蒸馏与变分自编码器的命名实体识别方法,属于人工智能的自然语言处理技术领域,包括以下步骤:构建有偏数据集对BERT‑large模型进行训练,获得有偏模型,作为教师模型;构建含跨域实体的数据集,结合变分自编码器对BERT‑large模型进行训练,获得学生模型;获取教师模型的输出特征,并从学生模型的变分自编码器的映射空间中解耦出鲁棒性特征和非鲁棒性特征;基于知识蒸馏将非鲁棒性特征与教师模型的输出特征进行拟合,进一步解耦出学生模型中更加鲁棒的特征,基于解耦出的鲁棒性特征进行命名实体识别。本发明实现了对命名实体识别任务中捷径学习的有效缓解,提升了命名实体识别任务的准确性。

    基于信号通道缩放和频域特征补全的人类活动识别方法

    公开(公告)号:CN118070106A

    公开(公告)日:2024-05-24

    申请号:CN202410465732.1

    申请日:2024-04-18

    Applicant: 吉林大学

    Abstract: 本发明提出了基于信号通道缩放和频域特征补全的人类活动识别方法,属于人类活动识别技术领域,包括:对人体活动中的传感器数据进行预处理,获取频域信息和时域信息;对所述频域信息和时域信息进行特征提取,并对提取的特征进行压缩以及特征融合,获取时频融合特征;利用预设分类器对所述时频融合特征进行分类识别,获取人体活动识别结果。本发明有效地校准了多通道信号的特征表示,更好地缓解了人类识别活动中数据的异质性问题,实现人类识别活动的准确识别。

    基于历时汉字知识图谱的古文字相似度量化方法

    公开(公告)号:CN114707615B

    公开(公告)日:2023-07-25

    申请号:CN202210461219.6

    申请日:2022-04-28

    Applicant: 吉林大学

    Abstract: 本发明提出了一种基于历时汉字知识图谱的古文字相似度量化方法,属于文字识别技术领域,该方法由历时汉字知识图谱构建步骤和古文字字形相似度计算步骤两部分组成;本发明构建知识图谱,并基于该知识图谱提出了古文字字形相似度的自动化度量方法。在汉字知识库的设计上,本发明首次针对汉字和词汇的特点,从字形、部件、文字、词汇、义项等完整层次进行建模,从而构成了汉字之间的关联网络,并且图谱具有历时性,可以关联中国各个历史时期的文字。在字形相似度的计算上,本发明利用历时汉字知识图谱中的知识,使古文字字形之间的相似性可以被量化计算。本发明提出的方法可以帮助古文字研究人员高效获取领域知识。

    一种教师自主支持性教学行为自动识别方法

    公开(公告)号:CN115658860B

    公开(公告)日:2023-06-06

    申请号:CN202211284440.5

    申请日:2022-10-17

    Applicant: 吉林大学

    Abstract: 本发明公开了一种教师自主支持性教学行为自动识别方法,包括:采集教师授课语音,基于语音分割技术将授课语音进行分割处理,获得单句语音;利用语音识别技术将单句语音转换为教学行为文本信息;基于文本信息构建教学行为数据集;构建教学行为识别模型,将教学行为数据集输入所述教学行为识别模型进行训练,获得目标教学行为识别模型;基于目标教学行为识别模型对教师自主支持性教学行为进行智能识别,本发明通过构建首个自主支持性教学行为训练集,设计教学行为识别算法,实现在大规模真实课堂场景中自动、快速识别教师自主支持性教学行为。

    一种基于图增强的互学习文本分类方法及系统

    公开(公告)号:CN115599918A

    公开(公告)日:2023-01-13

    申请号:CN202211360252.6

    申请日:2022-11-02

    Abstract: 本申请公开了一种基于图增强的互学习文本分类方法及系统,包括预处理待分类文本,得到文本图结构和文本序列;基于所述文本图结构,构建图文本分类模型;将所述文本序列输入预训练语言模型中;基于所述图文本分类模型和所述预训练语言模型,构建互学习框架;对所述互学习框架进行学习和更新,得到互学习文本分类结果。一种利用互学习方式的图文本分类模型与预训练语言模型有效结合的框架,基于图文本分类模型与预训练语言模型相结合,在一个框架下同时对两个基本模型进行优化;通过使用不同的学习率、学习次数克服两种不同模型收敛速度不匹配的问题。

    一种健康知识图谱的构建方法及系统

    公开(公告)号:CN109669994A

    公开(公告)日:2019-04-23

    申请号:CN201811570602.5

    申请日:2018-12-21

    Applicant: 吉林大学

    Inventor: 徐昊 迟杨

    Abstract: 本发明涉及一种健康知识图谱的构建方法,包括:利用html标签和正则表达式直接从网络数据源抽取结构化和半结构化数据中的属于概念化表示的用户、症候、疾病、专家、治疗方案和商品的各自的实体;利用条件随机场算法对非结构化数据抽取出属于上述六个概念化表示的实体;对同一上下文中抽取到的实体对使用Bi-LSTM算法进行关系分类,确定实体间的关系;计算实体名称和实体描述之间的相关性,实现实体信息的消歧;利用jena工具的owl推理函数补全知识图谱关系,并利用准则捕捉歧义三元组,将判定可能有错误的三元组反馈给领域专家进行验证。本发明的有益效果为:构建中医理论的健康知识图谱,并运用知识推理技术对残缺关系加以自动补全,构建更加完善的健康图谱。

    基于密度图的古籍图像检测方法及系统

    公开(公告)号:CN119027967B

    公开(公告)日:2025-02-14

    申请号:CN202411534511.1

    申请日:2024-10-31

    Applicant: 吉林大学

    Abstract: 本发明公开了基于密度图的古籍图像检测方法及系统,涉及计算机视觉及深度学习技术领域,方法包括:获取原始古籍文字图像,将所述原始古籍文字图像输入古籍图像检测网络进行检测,输出检测结果;其中,所述古籍图像检测网络由古文字检测子网络和基于语义的密度图生成子网络构成,所述古文字检测子网络用于对输入的原始古籍文字图像进行检测,获得初始检测结果;所述基于语义的密度图生成子网络用于生成密度图,并基于所述密度图对所述原始古籍文字图像进行裁剪,获得候选区域与原始图像的预测边界框。本发明提高了古籍图像中小文字的检测效果。

Patent Agency Ranking