-
公开(公告)号:CN114707511A
公开(公告)日:2022-07-05
申请号:CN202210275512.3
申请日:2022-03-21
Applicant: 北京理工大学
IPC: G06F40/30 , G06F40/289 , G06F16/215 , G06F16/29 , G06F16/9537
Abstract: 本发明涉及一种基于开源时空数据的时空目标描述文字生成方法,属于时空数据分析与挖掘技术领域。本方法通过分析时空目标数据的特点,经过数据清洗、行为描述短语生成、位置描述短语生成和目标描述生成,提取时空目标活动轨迹的语义信息,生成目标活动状态文字描述,可用于时空数据语义理解等。本方法能够对不含显示语义信息的时空数据进行理解,能够准确、高效地分析时空数据中各时空目标的行为模式,并能够准确识别时空数据在地图上所经过的地理位置,不依赖于在线网络,可以实现面向海量时空数据的快速语义感知,为时空数据语义分析提供技术支撑。本发明拓展了时空数据的应用范围,具有良好的应用前景。
-
公开(公告)号:CN113435436A
公开(公告)日:2021-09-24
申请号:CN202110619690.9
申请日:2021-06-03
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于线性约束矫正网络的场景文字识别方法,属于图像文本识别检测技术领域。本方法通过卷积网络对文本图像提取几何特征,得到空间变换参数,基于空间变换网络得到的参数,对倾斜文本图像进行分割,得到水平文本图像;利用校正后水平文本图像进行文字识别,提取图像特征。利用序列编解码网络和注意力机制进行文字识别,得到识别后的文本序列。将预测输出与目标进行损失计算,并更新网络参数。本方法矫正所需空间变换参数更灵活,可实现更复杂变换。空间变化网络输出的控制点被约束在一系列间距相同的边上,矫正后的图片更平滑,减少对后续任务的干扰。空间变换网络与特征提取层共享参数信息,在减少参数量的同时,提高了模型表现。
-
公开(公告)号:CN111026845B
公开(公告)日:2021-09-21
申请号:CN201911246473.9
申请日:2019-12-06
Applicant: 北京理工大学
Abstract: 本发明涉及一种获取多层次上下文语义的文本分类方法,属于自然语言处理文本分类技术领域。使用稠密连接的双向循环神经网络Bi‑LSTM获取多层次的上下文语义,使用卷积神经网络CNN的max‑pooling层对抽取的多层次上下文语义进行语义特征提取,再将文本中每个词的词向量和该词的多层次上下文语义特征向量进行连接得到的结果输入到分类层,实现文本分类。所述方法最大程度的保留了上下文语义信息;每个中间层都能获取到一定层次的语义,且将当前层获得的语义传递到下一层,获取更深层次的语义;极大的降低了神经网络梯度消失的概率;既保留了卷积神经网络特征抽取能力强的优点,又省去了卷积层,从而降低了训练参数和时间复杂度。
-
公开(公告)号:CN111026845A
公开(公告)日:2020-04-17
申请号:CN201911246473.9
申请日:2019-12-06
Applicant: 北京理工大学
Abstract: 本发明涉及一种获取多层次上下文语义的文本分类方法,属于自然语言处理文本分类技术领域。使用稠密连接的双向循环神经网络Bi-LSTM获取多层次的上下文语义,使用卷积神经网络CNN的max-pooling层对抽取的多层次上下文语义进行语义特征提取,再将文本中每个词的词向量和该词的多层次上下文语义特征向量进行连接得到的结果输入到分类层,实现文本分类。所述方法最大程度的保留了上下文语义信息;每个中间层都能获取到一定层次的语义,且将当前层获得的语义传递到下一层,获取更深层次的语义;极大的降低了神经网络梯度消失的概率;既保留了卷积神经网络特征抽取能力强的优点,又省去了卷积层,从而降低了训练参数和时间复杂度。
-
公开(公告)号:CN114443855B
公开(公告)日:2025-05-06
申请号:CN202210020693.5
申请日:2022-01-10
Applicant: 北京理工大学
IPC: G06F16/36 , G06F16/31 , G06F16/951 , G06F16/35 , G06F40/263 , G06F40/295 , G06F40/30 , G06N3/045 , G06N3/0464 , G06N3/042
Abstract: 本发明涉及一种基于图表示学习的知识图谱跨语言对齐方法,属于自然语言处理技术领域。在知识图谱构建阶段,通过爬取网站数据作为来源。然后,过滤筛选多语言实体并抽取其结构化数据组成三元组,构建知识图谱。在对齐阶段,通过图表示学习,将不同来源的知识图谱生成对应的嵌入矩阵,在图嵌入基础上,依靠已对齐实体,将不同语言知识图谱中的实体合并到统一的空间中,并根据实体在联合语义空间中的距离进行对齐。本方法充分利用了知识图谱结构信息,通过图表示学习方法将不同语言知识图谱中的实体合并到统一的空间中,并根据实体在联合语义空间中的距离进行对齐,保证了融合后的数据更准确全面,提高了在跨语言领域进行快速分析和智能搜索的效率。
-
公开(公告)号:CN119271873A
公开(公告)日:2025-01-07
申请号:CN202411045781.6
申请日:2024-08-01
Applicant: 北京理工大学
IPC: G06F16/9535 , G06Q50/20 , G06Q10/0639 , G06F18/213 , G06N3/0455 , G06N3/0895
Abstract: 本发明涉及一种基于知识追踪模型的个性化编程题推荐方法,属于信息推荐技术领域。本方法通过知识追踪模型,将学习者的知识状态变化过程融合到编程题推荐过程中,使所推荐的编程题符合学习者当前的学习进程和学习能力。本发明提出了一种基于特征增强和注意力机制的知识追踪模型,充分利用编程题信息和学习者历史知识状态信息更准确地预测学习者未来的答题表现。结合上述模型,本发明采用了个性化编程题推荐策略,将学习者的知识状态变化情况融入推荐过程,从而推荐出符合学习者当前的学习进程和学习能力的编程题。本方法能够更加准确地预测学习者在下一个时间步的答题表现,使编程题推荐策略能够及时根据学习者的知识状态变化情况调整推荐题目。
-
公开(公告)号:CN118446202A
公开(公告)日:2024-08-06
申请号:CN202410558437.0
申请日:2024-05-08
Applicant: 北京理工大学
IPC: G06F40/194 , G06F40/16 , G06F18/22 , G06F18/214 , G06F18/21 , G06F18/25
Abstract: 本发明涉及一种基于写作风格的生成文本来源检测方法,属于人工智能与文本检测技术领域,该方法包括:S1,生成文本内容的识别与编码;S2,特征提取;S3,特征输入与融合;S4,损失函数计算与优化;S5,训练模型;S6,根据训练好的模型,验证集评估模型的准确率和召回率,根据结果优化模型参数。在步骤S3中,对于每个文本样本,使用Llama2计算其困惑度分数。本发明使用多维特征融合框架,通过计算文本困惑度分数和嵌入向量并将其融合来代表各个文本生成源的写作风格,有效捕获了群体写作风格的核心特征,增强了文本源的区分能力,显著地提升了基于写作风格的识别性能,对保护文本的真实性有重要的意义。
-
公开(公告)号:CN117150113A
公开(公告)日:2023-12-01
申请号:CN202310625164.2
申请日:2023-05-30
Applicant: 北京理工大学
IPC: G06F16/9535 , G06F40/126 , G06N3/0442 , G06N3/045 , G06N3/048
Abstract: 本发明涉及一种基于长短期偏好的科技情报推荐方法,属于推荐系统领域,可用于为用户提供个性化的科技情报推荐。该方法包括:利用多头自注意力机制分别提取情报标题和摘要的表示,然后结合情报来源表示以获取更准确的情报表示;采用长短期记忆网络和用户ID嵌入的方法学习长短期偏好表示;以及将长短期偏好表示与情报表示相结合,计算推荐得分,从而实现个性化的科技情报推荐。本发明解决了现有推荐系统在情报表示方面的不足以及在捕捉用户长短期兴趣方面不精确的问题,可以在推荐过程中捕捉到新颖性和突发性的科技情报,适用于国防、科研、教育等领域的情报推荐场景,有助于提高情报工作人员的工作效率,促进知识传播和技术创新。
-
公开(公告)号:CN116186191A
公开(公告)日:2023-05-30
申请号:CN202210320305.5
申请日:2022-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京理工大学
Abstract: 本发明涉及基于多维信息的任务匹配方法,属于基于大数据智能分析与挖掘技术领域。本发明是结合文本处理、机器学习方法、线性模型、动态规划等方法对相应文本进行处理,从而对文本所含“价值”进行分析,并借助大数据的手段将人工主观文本分析变为自动化完成,提高系统找到匹配结果的效率。本发明采用多种大数据分析的思想和多路召回的思想,对于同一任务会召回多个表单,每一个表单进行同样的操作,设置不同的权重,最后多路交集,从而可以取到更加准确的筛选结果,大大提高了工作效率。
-
公开(公告)号:CN115358234A
公开(公告)日:2022-11-18
申请号:CN202210828795.X
申请日:2022-07-14
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于图卷积网络与关系证据互指导的篇章关系抽取方法,属于计算机自然语言处理技术领域。本发明针对文档级别的文本,构造包含实体提及和实体关系两种节点的文档图,利用图卷积神经网络学习关系表征。同时,利用关系表征指导证据集抽取网络抽取对应的证据集,最后将证据集表征融入关系表征进行关系判别。本发明通过关系抽取和证据集抽取两通道任务的联合训练。关系抽取为证据集抽取提供特定关系信息,证据集抽取为关系抽取提供依据信息,从而提高篇章关系抽取的效果。同时,在文档图中创新性的增加关系节点促进了实体之间的消息传递,有利于模型充分学习语义表征。
-
-
-
-
-
-
-
-
-