-
公开(公告)号:CN110738047B
公开(公告)日:2021-04-20
申请号:CN201910828734.1
申请日:2019-09-03
Applicant: 华中科技大学
IPC: G06F40/289 , G06F40/279 , G06F16/35 , G06F16/9535 , G06F16/9536 , G06F16/9537 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于图文数据与时间效应的微博用户兴趣挖掘方法及系统,属于数据挖掘领域,包括:对于任意一个用户u,获得待分析的历史微博集合;每一条历史微博,提取其中的文本和图片后,从文本提取词汇特征向量,从图片提取图片语义特征向量,并组合为该微博的微博特征向量;利用基于Single‑Pass的多阶段不完全聚类方法对历史微博集合进行聚类,得到多个微博簇;根据聚类结果生成微博簇‑词汇矩阵,并利用已训练好的主题模型将其分解为微博簇‑主题概率分布矩阵和主题‑词汇概率分布矩阵,同时得到K个主题;利用拟合时间函数对微博簇‑主题概率分布矩阵进行降维,以得到用户u在各主题上的倾向概率。本发明能够全面、准确地表达微博用户的兴趣倾向。
-
公开(公告)号:CN112148916B
公开(公告)日:2024-12-13
申请号:CN202011044741.1
申请日:2020-09-28
Applicant: 华中科技大学
IPC: G06F16/583 , G06F16/538 , G06V10/74 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于监督的跨模态检索方法、装置、设备及介质,方法包括:对图像模态和文本模态的训练样本数据进行特征提取;将提取的图像数据特征和文本数据特征映射至公共表示空间;分别计算标签空间的损失、公共表示空间中各个模态内和不同模态间的损失、以及图像和文本模态间的不变性损失,并加以不同的权重,得到检索模型的损失函数;通过最小化损失函数来优化检索模型的参数;将目标检索数据利用优化后的检索模型映射到公共表示空间,计算目标检索数据与图文数据集中数据之间的相似度,得到对应的检索排序结果。如此,保留了不同语义数据样本的判别性以及原始数据的语义信息,能更有效地计算跨模态数据间的相关性,具有更高的检索准确率。
-
公开(公告)号:CN112199501B
公开(公告)日:2024-03-19
申请号:CN202011090173.9
申请日:2020-10-13
Applicant: 华中科技大学
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G06F40/284 , G06N3/0442 , G06N3/0464
Abstract: 本发明属于文本分类技术领域,具体涉及一种科技信息文本分类方法,包括:基于每个待分类的科技信息文本的文本特征,对该科技信息文本进行粗粒度弱分类,若分类结果不准确,对该科技信息文本粗粒度强分类,得到粗粒度类别;对文本抽取高层语义信息特征,并采用粗粒度类别辅助粗粒度类别对应的细粒度分类器来基于高层语义信息特征对文本进行细粒度弱分类,若分类结果不准确,采用细粒度强分类器,最终得到该文本的细粒度类别,细粒度强分类器为采用科技文本数据微调已在海量文本数据中训练的深度神经网络模型所得。本发明基于多粒度组合优化进行文本分类,将分类任务进行分解,通过强化简单的子任务性能,高效地提升文本分类任务的准确率和性能。
-
公开(公告)号:CN114021549A
公开(公告)日:2022-02-08
申请号:CN202111202239.3
申请日:2021-10-15
Applicant: 华中科技大学 , 武汉烽火技术服务有限公司
IPC: G06F40/216 , G06F40/295 , G06F40/30 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于词汇增强和多特征的中文命名实体识别方法及装置,属于信息抽取技术领域,方法包括:结合双向长短期记忆网络和卷积神经网络提取输入序列的字符特征、通过字符串模式匹配的方式引入字符对应的词汇信息并以词频加权平均的方式提取词汇特征以及使用预训练模型提取预训练特征;使用门控机制来控制词汇特征对字符特征的词汇增强;线性拼接经过词汇增强后的字符特征和预训练特征以构建多特征;基于多特征的上下文相关性以获取上下文特征;标签解码结合上下文特征预测输入序列最佳标签序列。从而使得,提取中文序列的字符特征更充分;提取的词汇特征更丰富且避免了中文分词误差的影响;使用多特征结合的策略模式提高了实体识别指标。
-
公开(公告)号:CN113743011A
公开(公告)日:2021-12-03
申请号:CN202111017563.8
申请日:2021-08-31
Applicant: 华中科技大学 , 武汉烽火技术服务有限公司
IPC: G06F30/27 , G06N3/00 , G06N3/04 , G06N3/08 , G06F119/04
Abstract: 本发明公开了一种基于PSO‑BP神经网络的设备寿命预测方法和系统,属于设备寿命预测。包括:1)通过获取设备的寿命周期数据,构建数据集,并进行归一化处理;2)构建BP神经网络;3)将BP神经网络的权值和阈值作为粒子的维度分量,并对粒子群算法的参数进行初始化,确定个体最优位置、最优适应度、全局最优位置和适应度;4)采用BP神经网络对数据集进行训练,所得结果由粒子群算法筛选出最优粒子,即网络的最优权值和阈值;5)将粒子群算法的结果作为网络的初始权值和阈值进行训练,直到满足最小误差条件或最大训练次数;6)用训练好的网络对设备数据进行预测,输出设备的预测寿命。与其它技术相比,本方法的优势在于可以迅速精确的完成对设备寿命的预测。
-
公开(公告)号:CN112148916A
公开(公告)日:2020-12-29
申请号:CN202011044741.1
申请日:2020-09-28
Applicant: 华中科技大学
IPC: G06F16/583 , G06F16/538 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于监督的跨模态检索方法、装置、设备及介质,方法包括:对图像模态和文本模态的训练样本数据进行特征提取;将提取的图像数据特征和文本数据特征映射至公共表示空间;分别计算标签空间的损失、公共表示空间中各个模态内和不同模态间的损失、以及图像和文本模态间的不变性损失,并加以不同的权重,得到检索模型的损失函数;通过最小化损失函数来优化检索模型的参数;将目标检索数据利用优化后的检索模型映射到公共表示空间,计算目标检索数据与图文数据集中数据之间的相似度,得到对应的检索排序结果。如此,保留了不同语义数据样本的判别性以及原始数据的语义信息,能更有效地计算跨模态数据间的相关性,具有更高的检索准确率。
-
公开(公告)号:CN119810838A
公开(公告)日:2025-04-11
申请号:CN202411869689.1
申请日:2024-12-18
Applicant: 华中科技大学
IPC: G06V20/70 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/082
Abstract: 本发明属于图像识别相关技术领域,其公开了一种图像识别系统及其训练方法、图像识别方法,该系统中:粗粒度场景感知模块识别出与输入图像最相关的场景;细粒度目标感知模块基于粗粒度场景感知模块所提供的信息计算各特征点与最相关场景下各目标的相似度得分;编码模块具有多分支自注意力计算单元,多分支注意力计算单元基于相似度得分将显著性特征点加入同一个自注意力分支,形成多分支自注意力图像编码,着重对所加入的显著性特征进行编码计算;解码模块对编码特征进行解码,识别输入图像中的目标。通过以上系统,可以降低编码器的计算复杂度,提高重点目标的特征提取能力,减少不同类别目标和图像背景区域的干扰,加快图像处理速度。
-
公开(公告)号:CN119649136A
公开(公告)日:2025-03-18
申请号:CN202411800077.7
申请日:2024-12-09
Applicant: 华中科技大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/74 , G06N3/0455 , G06N3/048 , G06N3/0475 , G06N3/08
Abstract: 本发明公开了一种小样本图像检测模型的训练方法和图像检测方法,属于深度学习技术领域,所述基类训练方法包括:利用支持图像集、已打标的查询图像和类中各个目标类别训练原始图像检测模型直至总损失达到收敛,得到基类图像检测模型;将支持特征和目标类别的语义嵌入输入变分自编码器,相比于特定类的支持特征和重构特征,VAE中间过程的潜在向量包含了更多类原型的一般特征;从分布中采样具有包含语义信息的潜在向量并将其与查询特征进行特征聚合,从而使估计的新类中心更接近真实的类中心;此外以VAE中的重构损失、KL散度、分类损失、回归损失以及语义一致性损失构成总损失,可以较大程度地提升训练精度。
-
公开(公告)号:CN114021549B
公开(公告)日:2024-10-22
申请号:CN202111202239.3
申请日:2021-10-15
Applicant: 华中科技大学 , 武汉烽火技术服务有限公司
IPC: G06F40/216 , G06F40/295 , G06F40/30 , G06F16/33 , G06N3/0464 , G06N3/08 , G06N3/044
Abstract: 本发明公开了一种基于词汇增强和多特征的中文命名实体识别方法及装置,属于信息抽取技术领域,方法包括:结合双向长短期记忆网络和卷积神经网络提取输入序列的字符特征、通过字符串模式匹配的方式引入字符对应的词汇信息并以词频加权平均的方式提取词汇特征以及使用预训练模型提取预训练特征;使用门控机制来控制词汇特征对字符特征的词汇增强;线性拼接经过词汇增强后的字符特征和预训练特征以构建多特征;基于多特征的上下文相关性以获取上下文特征;标签解码结合上下文特征预测输入序列最佳标签序列。从而使得,提取中文序列的字符特征更充分;提取的词汇特征更丰富且避免了中文分词误差的影响;使用多特征结合的策略模式提高了实体识别指标。
-
公开(公告)号:CN112199501A
公开(公告)日:2021-01-08
申请号:CN202011090173.9
申请日:2020-10-13
Applicant: 华中科技大学
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G06F40/284 , G06N3/04
Abstract: 本发明属于文本分类技术领域,具体涉及一种科技信息文本分类方法,包括:基于每个待分类的科技信息文本的文本特征,对该科技信息文本进行粗粒度弱分类,若分类结果不准确,对该科技信息文本粗粒度强分类,得到粗粒度类别;对文本抽取高层语义信息特征,并采用粗粒度类别辅助粗粒度类别对应的细粒度分类器来基于高层语义信息特征对文本进行细粒度弱分类,若分类结果不准确,采用细粒度强分类器,最终得到该文本的细粒度类别,细粒度强分类器为采用科技文本数据微调已在海量文本数据中训练的深度神经网络模型所得。本发明基于多粒度组合优化进行文本分类,将分类任务进行分解,通过强化简单的子任务性能,高效地提升文本分类任务的准确率和性能。
-
-
-
-
-
-
-
-
-