-
公开(公告)号:CN117150113A
公开(公告)日:2023-12-01
申请号:CN202310625164.2
申请日:2023-05-30
Applicant: 北京理工大学
IPC: G06F16/9535 , G06F40/126 , G06N3/0442 , G06N3/045 , G06N3/048
Abstract: 本发明涉及一种基于长短期偏好的科技情报推荐方法,属于推荐系统领域,可用于为用户提供个性化的科技情报推荐。该方法包括:利用多头自注意力机制分别提取情报标题和摘要的表示,然后结合情报来源表示以获取更准确的情报表示;采用长短期记忆网络和用户ID嵌入的方法学习长短期偏好表示;以及将长短期偏好表示与情报表示相结合,计算推荐得分,从而实现个性化的科技情报推荐。本发明解决了现有推荐系统在情报表示方面的不足以及在捕捉用户长短期兴趣方面不精确的问题,可以在推荐过程中捕捉到新颖性和突发性的科技情报,适用于国防、科研、教育等领域的情报推荐场景,有助于提高情报工作人员的工作效率,促进知识传播和技术创新。
-
公开(公告)号:CN116186191A
公开(公告)日:2023-05-30
申请号:CN202210320305.5
申请日:2022-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京理工大学
Abstract: 本发明涉及基于多维信息的任务匹配方法,属于基于大数据智能分析与挖掘技术领域。本发明是结合文本处理、机器学习方法、线性模型、动态规划等方法对相应文本进行处理,从而对文本所含“价值”进行分析,并借助大数据的手段将人工主观文本分析变为自动化完成,提高系统找到匹配结果的效率。本发明采用多种大数据分析的思想和多路召回的思想,对于同一任务会召回多个表单,每一个表单进行同样的操作,设置不同的权重,最后多路交集,从而可以取到更加准确的筛选结果,大大提高了工作效率。
-
公开(公告)号:CN115358234A
公开(公告)日:2022-11-18
申请号:CN202210828795.X
申请日:2022-07-14
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于图卷积网络与关系证据互指导的篇章关系抽取方法,属于计算机自然语言处理技术领域。本发明针对文档级别的文本,构造包含实体提及和实体关系两种节点的文档图,利用图卷积神经网络学习关系表征。同时,利用关系表征指导证据集抽取网络抽取对应的证据集,最后将证据集表征融入关系表征进行关系判别。本发明通过关系抽取和证据集抽取两通道任务的联合训练。关系抽取为证据集抽取提供特定关系信息,证据集抽取为关系抽取提供依据信息,从而提高篇章关系抽取的效果。同时,在文档图中创新性的增加关系节点促进了实体之间的消息传递,有利于模型充分学习语义表征。
-
公开(公告)号:CN114707516A
公开(公告)日:2022-07-05
申请号:CN202210322393.2
申请日:2022-03-29
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于对比学习的长文本语义相似度计算方法,属于人工智能、自然语言处理技术领域。本发明主要解决的技术问题为小样本场景下长文本语义匹配问题。首先通过爬虫、人工采集手段构建通用、领域数据库。其次使用领域数据库和通用数据库中包含的主题、标题、关键短语等篇章结构信息构建模型,通过有监督的文本表示学习方法对比学习进行训练。最后使用该模型对待评价文本进行预测来获得相似度打分,经过人工修正模块对该语义打分进行修正,并决定是否将该文本加入领域数据库进一步扩大训练资源。定期使用领域资源库更新模型,实现小样本下高精度语义相似度计算。
-
公开(公告)号:CN110991167B
公开(公告)日:2021-10-08
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
公开(公告)号:CN110991167A
公开(公告)日:2020-04-10
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
公开(公告)号:CN107247780A
公开(公告)日:2017-10-13
申请号:CN201710436963.X
申请日:2017-06-12
Applicant: 北京理工大学
CPC classification number: G06F17/30976 , G06F17/2785
Abstract: 本发明涉及一种基于知识本体的专利文献相似性度量方法,涉及面向专利文本的自然语言信息处理技术领域;该方法依据专利文献结构特点、位置特征和关键词特征提取核心技术方案;构建专利分类号主题词词间关系模型;根据分类号主题词词间关系模型构建领域词典并以之对核心技术方案分词和去停用词;主题词词间关系结合以TF‑IDF作为TextRank词初始权重提取关键词和权重;训练FastText模型,生成词向量;根据关键词、词权重和词向量,计算EMD距离,得出语义距离。对比现有技术,本发明解决了传统专利文献相似性度量方法未充分考虑专利文本结构特点,领域特点,词间关系特点及语义近似表述不一致导致的相似度低的问题。
-
公开(公告)号:CN105159879A
公开(公告)日:2015-12-16
申请号:CN201510531262.5
申请日:2015-08-26
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种网络个体或群体价值观自动判别方法,属于互联网信息挖掘与分析领域;包括:1)基于典型价值观三层树形结构搜集价值观新闻语料集;2)基于语料集及卡方统计方法构建典型价值观特征向量,并基于TF-IDF-IG方法计算其权重;3)基于步骤2)的方法确定社交网络个体的价值观特征向量,然后计算其与典型价值观特征向量的相似度,并进行价值观优先级评估;4)基于网络群体中每个个体的价值观优先级对其进行价值观分类,得到网络群体的价值观评估。对比现有技术,本发明基于网络大数据语料,对网络个体的价值观倾向进行定量评估以及对网络群体的价值观倾向进行定量评估,可用于网络舆论合理引导和管理控制,以及网络营销、人力资源管理等。
-
-
-
-
-
-
-