-
公开(公告)号:CN119829826A
公开(公告)日:2025-04-15
申请号:CN202411711190.8
申请日:2024-11-27
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/9535 , G06F18/22 , G06F16/23
Abstract: 本发明涉及一种多属性标签与评分的数据资产推荐方法,属于数据资产推荐技术领域。本发明改变单一的关键词检索被动获取所关心的数据资产信息的现状,根据数据资产的特点,进行多维度的属性分解,并利用数据资产与数据资产、用户与数据资产、用户与用户之间的关联性,设计推荐过程,形成较为准确的数据资产推荐内容,向用户主动推荐感兴趣的数据资产,提高推荐结果的准确性。
-
公开(公告)号:CN113486191A
公开(公告)日:2021-10-08
申请号:CN202110709394.8
申请日:2021-06-25
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/36 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/211 , G06F40/30
Abstract: 本发明涉及一种涉密电子文件定解密方法,属于文件定解密领域。本发明包括如下步骤:S1、涉密电子文件密点分析与样本收集;S2、基于信息增益的密点关键词挖掘;S3、基于知识图谱的密点关联规则库构建;S4融合军工密点规则集的知识图谱构建;S5、智能匹配对比与快速定解密。本发明通过智能化分析技术,加强涉密电子文件定解密工作的准确化、规范化;利用电子文件密点动态追踪手段,提升电子文件密级解除工作的及时性、准确性和智能性;通过密点比对和基于语义分析的智能匹配技术,实现涉密电子文件密级的实时确定、智能化变更和及时解密。
-
公开(公告)号:CN119829784A
公开(公告)日:2025-04-15
申请号:CN202411711340.5
申请日:2024-11-27
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于分类的快速以图搜图方法,属于信息检索技术领域。本发明主要解决以图搜图的速度问题,针对特征向量匹配量大、匹配速度待提高的情况,提出了一种快速检索方法,采用由粗到细、层次化的方式,降低匹配量级,并在此基础上进行特征向量降维、量化等方式,进一步提高检索速度,同时采取不同方法保证以图搜图的准确性。
-
公开(公告)号:CN114881032A
公开(公告)日:2022-08-09
申请号:CN202210462583.4
申请日:2022-04-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多任务学习的层次类别命名实体识别模型设计方法,属于自然语言处理技术领域。本发明通过在命名实体识别模型中加入对于类别关系的建模,使得模型能够同时识别出命名实体的多个类别,同时,本发明提出了基于多任务学习的模型来解决具有层次类别的命名实体识别问题。模型使用多任务学习机制同时学习多个层次的命名实体识别任务,这些任务共享同一个编码层,这样可以使得编码层学习到的编码向量可以同时适应多个层次的命名实体识别而不是过拟合于某一个单独的层次。最后,还分别设计了两种信息传递机制传递不同层次间的识别信息,以提高模型的识别效果。
-
公开(公告)号:CN117521666B
公开(公告)日:2025-04-04
申请号:CN202311451928.7
申请日:2023-11-03
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/211 , G06F40/117 , G06F16/334 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。
-
公开(公告)号:CN113486191B
公开(公告)日:2024-04-05
申请号:CN202110709394.8
申请日:2021-06-25
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/36 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/211 , G06F40/30
Abstract: 本发明涉及一种涉密电子文件定解密方法,属于文件定解密领域。本发明包括如下步骤:S1、涉密电子文件密点分析与样本收集;S2、基于信息增益的密点关键词挖掘;S3、基于知识图谱的密点关联规则库构建;S4融合军工密点规则集的知识图谱构建;S5、智能匹配对比与快速定解密。本发明通过智能化分析技术,加强涉密电子文件定解密工作的准确化、规范化;利用电子文件密点动态追踪手段,提升电子文件密级解除工作的及时性、准确性和智能性;通过密点比对和基于语义分析的智能匹配技术,实现涉密电子文件密级的实时确定、智能化变更和及时解密。
-
公开(公告)号:CN110532557B
公开(公告)日:2023-07-28
申请号:CN201910807636.X
申请日:2019-08-29
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/216 , G06F40/30 , G06F18/22 , G06N3/088 , G06N3/0442 , G06N3/045
Abstract: 本发明涉及一种无监督的文本相似度计算方法,其中,包括:步骤一:进行嵌入层模型预训练,对问题集合中的所有词进行预训练,生成满足模型需要的词向量;步骤二:编码层网络,挖掘句子的语义信息;步骤三:进行基于TFIDF融合的模型改进,包括:在每条问句输入到神经网络的同时,对输入的每条问句进行TFIDF的计算,并将计算好的权值输入到神经网络中,控制最后的句子向量表示,采用了归一化的TFIDF计算方法,并将其融入到编码层和表示层。本发明将深度神经网络模型(Bi‑LSTM)用于语料库的无监督训练,得到语言模型,通过无监督的训练方式,可以充分地利用大规模的语料库的信息,从而提高文本匹配的准确率,提升信息检索的精度。
-
公开(公告)号:CN113535573B
公开(公告)日:2023-07-14
申请号:CN202110841584.5
申请日:2021-07-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F11/36 , G06F8/41 , G06F8/30 , G06Q10/0639 , G06Q30/0601
Abstract: 本发明涉及一种基于GOMS模型改进的软件可用性量化评估方法,属于软件评估领域。本发明基于GOMS模型改进的软件可用性量化评估方法,对于软件的不同业务采用专家打分法对业务的使用频率、重要程度进行打分,从而确定各个业务的权重;将业务目标分为几个子目标,子目标可以继续细分,直到分解成不能分解的基本操作;以GOMS模型基本操作时间为基础,计算出不同基本操作的复杂度;根据基本操作的复杂度,计算业务复杂度;根据软件系统各个业务的复杂度,得到软件系统的复杂度。本发明对于软件系统的不同设计方案,通过计算各方案的软件界面设计复杂度,软件界面设计的复杂度越高,软件可用性越差,由此即可实现各设计方案的软件可用性的量化评估。
-
公开(公告)号:CN114881032B
公开(公告)日:2025-05-06
申请号:CN202210462583.4
申请日:2022-04-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F16/35 , G06N3/045 , G06N3/096 , G06N3/09
Abstract: 本发明涉及一种基于多任务学习的层次类别命名实体识别模型设计方法,属于自然语言处理技术领域。本发明通过在命名实体识别模型中加入对于类别关系的建模,使得模型能够同时识别出命名实体的多个类别,同时,本发明提出了基于多任务学习的模型来解决具有层次类别的命名实体识别问题。模型使用多任务学习机制同时学习多个层次的命名实体识别任务,这些任务共享同一个编码层,这样可以使得编码层学习到的编码向量可以同时适应多个层次的命名实体识别而不是过拟合于某一个单独的层次。最后,还分别设计了两种信息传递机制传递不同层次间的识别信息,以提高模型的识别效果。
-
公开(公告)号:CN117217222A
公开(公告)日:2023-12-12
申请号:CN202310746380.2
申请日:2023-06-25
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F18/15 , G06F18/214 , G06F18/241
Abstract: 本发明涉及一种军事领域标注数据修正与事件检测方法,属于信息抽取技术领域。本发明使用原始数据集训练模型,并对原始标注数据进行预测,对于预测得分大于一定阈值的样本,将原始数据集的标注结果修改为模型预测结果,从而修正数据集中的错误标注数据和污染数据,提高训练集的质量。本发明在模型训练时引入了分层学习率策略,为靠近下游任务的模型层参数设置更大的学习率,提高预训练模型对于下游任务的适配能力;在模型推理时采用基于投票修正的模型融合方法,通过模型集成的方式提升少样本类别事件的召回率和准确率,融合多个模型的投票结果确定最终预测结果,从而提升模型的鲁棒性。
-
-
-
-
-
-
-
-
-