-
公开(公告)号:CN118940299A
公开(公告)日:2024-11-12
申请号:CN202411402787.4
申请日:2024-10-09
Applicant: 天津中科闻歌科技有限公司 , 北京中科闻歌科技股份有限公司
Abstract: 本发明提供了一种提高目标模型的安全性的方法、电子设备及存储介质,涉及模型技术领域,所述方法能够根据指定数据集的总集获取增量权重列表,进一步的获取第四类指令对应的模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,通过更新目标模型的权重来提高目标模型的安全性,可知本发明通过权重组合的方式获取模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,提高目标模型的安全性的同时能够缓解目标模型针对第五类指令的过度防御,第五类指令为与第四类指令有相似的构建方式但不会指导目标模型违反其内部的安全策略并输出不良内容的指令,无需混合大量的通用指令数据,节省了算力时间消耗,对计算机设备的显存要求较低。
-
公开(公告)号:CN115840804A
公开(公告)日:2023-03-24
申请号:CN202211602874.5
申请日:2022-12-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/35 , G06F16/33 , G06F40/295
Abstract: 本发明提供了一种面向航空装备知识图谱的问答系统,包括:处理器和存储有一段计算机程序的存储器,当所述处理器执行一段计算机程序时,实现如下步骤:对目标问句进行处理,获取目标问句对应的目标问句向量、目标头实体和目标问答类型,对目标头实体和航空装备知识图谱嵌入表示进行实体链接,获取对应的目标头实体表示向量,将目标问句向量、目标头实体表示向量和目标问答类型输入到判别模型,获取候选答案列表和候选答案得分列表,确定目标答案向量集,本发明融合了得分阈值的筛选,使得问答的效果更为精准。
-
公开(公告)号:CN114723542A
公开(公告)日:2022-07-08
申请号:CN202210369630.0
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种办税异常绑定行为的检测方法、装置、设备及存储介质,其中方法包括:获取企业办税人的办税绑定行为数据;对所述办税绑定行为数据进行特征提取处理,得到与所述企业办税绑定行为相关的特征;将所述特征输入预设的企业绑定行为风险量化模型,基于所述企业绑定行为风险量化模型对所述企业进行异常办税绑定行为检测。本公开基于企业绑定行为风险量化模型进行异常办税绑定行为检测,考虑了办税绑定行为数据中风险特征的提取及量化,提升了泛化性能和普适性,减少了检测方案对个人领域经验的依赖,并提高了异常办税绑定行为检测的准确率和检测效率。
-
公开(公告)号:CN114936282A
公开(公告)日:2022-08-23
申请号:CN202210470144.8
申请日:2022-04-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括:获取待分类文本,并对待分类文本进行分词处理,得到各目标词语;基于各目标词语和目标词向量索引表,生成待分类文本对应的第一融合词向量组合;其中,目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建,初始文本样本集为文本分类模型的训练样本集,预设向量转换算法用于将文本转换为多级别的词向量;将第一融合词向量组合输入文本分类模型,并根据模型输出结果确定待分类文本的目标文本类型;基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案,有效地提升了文本分类速度,进而提升线上金融业务中违规行为信息的发现效率。
-
公开(公告)号:CN114004605A
公开(公告)日:2022-02-01
申请号:CN202111651786.X
申请日:2021-12-31
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本发明实施例涉及一种发票超限量申请审批方法、装置、设备和介质。该方法包括:获取待审批实体的实体信息和涉税数据,其中,所述待审批实体为发起发票超限量申请的实体;基于所述实体信息和所述涉税数据,构建第一基础特征向量;基于所述第一基础特征向量,生成第一衍生特征向量;其中,所述第一衍生特征向量用于反映所述待审批实体属于审批通过类型或审批拒绝类型的区分程度;将所述第一基础特征向量和所述第一衍生特征向量输入预先训练得到的目标申请审批模型,并基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果。通过上述技术方案,提高了审批方案的泛化性能和审批准确性。
-
公开(公告)号:CN112308638A
公开(公告)日:2021-02-02
申请号:CN202011187087.X
申请日:2020-10-29
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请实施例提供一种虚开发票行为检测方法、装置、电子设备及存储介质,方法包括:确定目标纳税实体的涉税数据,涉税数据包含开票数据,从涉税数据中提取目标纳税实体的虚开发票行为特征向量,将虚开发票行为特征向量输入预先训练好的随机森林模型,以使随机森林模型输出目标纳税实体的虚开发票数据,若虚开发票数据满足预设条件,则确定目标纳税实体是虚开发票纳税实体。本方案充分考虑了涉税数据中蕴含的纳税实体的虚开发票行为特征,更加精细的刻画纳税实体的特点,采用预先训练好的随机森林模型,基于纳税实体的虚开发票行为特征对纳税实体进行虚开发票检测,避免了以往基于指标评价体系的方案中指标阈值难以科学合理确定的局限和不足。
-
公开(公告)号:CN118627492B
公开(公告)日:2025-01-24
申请号:CN202411092157.1
申请日:2024-08-09
Applicant: 北京中科闻歌科技股份有限公司 , 天津中科闻歌科技有限公司
IPC: G06F40/216 , G06F40/226
Abstract: 本发明提供了一种检测目标模型的方法、电子设备及存储介质,涉及模型检测技术领域,所述方法能够根据指定选择题数据列表集合的总集和目标模型获取预设选项标签列表对应的第一累计被选择次数列表集合,获取第一累计被选择次数列表集合对应的关键向量列表集合并获取关键向量列表集合对应的关键向量相关系数列表,当大于预设向量相关系数的关键向量相关系数的数量与所有关键向量相关系数的比值不大于预设比值时,确定目标模型在生成选择题答案时不存在选项标签偏见或选项位置偏好,可知本发明能够检测出目标模型在生成选择题答案时是否存在选项标签偏见或选项位置偏好,有利于增强目标模型的可靠性,提高目标模型在教育和测试等环境中的公正性。
-
公开(公告)号:CN115713427A
公开(公告)日:2023-02-24
申请号:CN202211408253.3
申请日:2022-11-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q40/12
Abstract: 本公开涉及一种新迁入企业税前税源管理方法、装置、设备及存储介质。本公开实施例,通过获取新迁入企业的第一经营纳税数据以及与新迁入企业存在关联关系的其他企业的第二经营纳税数据;对第一经营纳税数据进行特征提取处理,得到新迁入企业的纳税异常特征向量;确定各关联关系对应的新迁入企业所属的企业社区以及社区特征向量;基于纳税异常特征向量和社区特征向量得到新迁入企业对应的税前监控特征向量;将税前监控特征向量输入预设的新迁入企业税前监控模型,基于企业税前监控模型对新迁入企业进行税前监控,可以在海量新迁入企业的税前税源管理中对异常新迁入企业进行精准稳定地的识别与预警,提高对异常税源预警响应的时效性和准确性。
-
公开(公告)号:CN115271892A
公开(公告)日:2022-11-01
申请号:CN202210547647.0
申请日:2022-05-18
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q40/00 , G06F16/2458 , G06F16/2457 , G06N3/04 , G06N3/08 , G06Q50/26
Abstract: 本公开实施例提供了一种骗取留抵退税识别模型的构建方法、装置、设备和存储介质。骗取留抵退税识别模型构建方法包括获取多个样本退税申请数据序列和对应的实体标签;基于样本退税申请数据序列确定对应的第一特征向量;基于多个第一特征向量和对应的实体标签对预先构建的骗取留抵退税识别模型进行训练。骗取留抵退税识别模型构建方法能够直接挖掘样本退税申请数据的特征构建骗取留抵退税识别模型,而无需如现有专家评价指标体系的方法需要依靠专家经验设定评价指标、指标权重和指标阈值的问题。
-
公开(公告)号:CN114936282B
公开(公告)日:2024-06-11
申请号:CN202210470144.8
申请日:2022-04-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/24 , G06F18/23 , G06F18/214 , G06N3/04 , G06Q10/0635 , G06Q40/00
Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括:获取待分类文本,并对待分类文本进行分词处理,得到各目标词语;基于各目标词语和目标词向量索引表,生成待分类文本对应的第一融合词向量组合;其中,目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建,初始文本样本集为文本分类模型的训练样本集,预设向量转换算法用于将文本转换为多级别的词向量;将第一融合词向量组合输入文本分类模型,并根据模型输出结果确定待分类文本的目标文本类型;基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案,有效地提升了文本分类速度,进而提升线上金融业务中违规行为信息的发现效率。
-
-
-
-
-
-
-
-
-