-
公开(公告)号:CN119558399A
公开(公告)日:2025-03-04
申请号:CN202411502201.1
申请日:2024-10-25
Applicant: 航天信息股份有限公司
IPC: G06N5/04 , G06N20/00 , G06N3/0495
Abstract: 本发明公开了一种用于构建模型训练数据的方法、系统、设备及介质,属于数据处理技术领域。本发明方法,包括:针对目标领域模型,确定所述目标领域模型的模型信息,并确定用于训练目标领域模型的模型训练数据的数据来源;对所述初始模型训练数据进行错误数据的清洗处理、篇章级和句子级的排重处理以及安全性数据过滤处理,得到待评估的模型训练数据;构建用于评估模型训练数据质量的评估指标;对所述待评估的模型训练数据的质量进行评估,确定评估结果是否符合评估指标阈值,将符合评估指标阈值的待评估的模型训练数据,作为模型训练数据进行输出。本发明能够构建模型所需的数据集,节省了人力及时间成本,并且降低了数据集的构建难度。
-
公开(公告)号:CN115775093A
公开(公告)日:2023-03-10
申请号:CN202211448114.3
申请日:2022-11-18
Applicant: 航天信息股份有限公司 , 河北航天信息技术有限公司
IPC: G06Q10/0635 , G06Q40/12
Abstract: 本发明公开了一种用于构建进销项敏感商品库的方法及装置,包括:获取企业的进销项商品信息;根据所述企业的进销项商品信息,确定所述企业的主销商品和主购商品;通过计算所述主销商品和主购商品的笛卡尔积,获得多个进销项商品组合;根据所述进销项商品组合的商品编码、置信度和支持度,获得异常进销项商品组合;基于所述异常进销项商品组合的数量,计算所述企业的背离度;根据所述背离度,若确定所述企业为高风险企业,则挖掘所述企业的高风险进项商品、高风险销项商品和高风险进销项商品组合;由所述高风险进项商品、高风险销项商品和高风险进销项商品组合构建所述进销项敏感商品库,解决风险预判对业务人员强依赖、效率不高的问题。
-
公开(公告)号:CN115496066A
公开(公告)日:2022-12-20
申请号:CN202211181576.3
申请日:2022-09-27
Applicant: 航天信息股份有限公司
IPC: G06F40/289 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种文本分析系统、方法、电子设备及存储介质,该系统包括预处理模块和文本分析模块;文本分析模块包括多级文本分类单元、文本摘要抽取单元、标签要素抽取单元、智能文本推荐单元和情感意图分析单元中的至少一个;多级文本分类单元用于根据文本向量对待处理文本进行分类;文本摘要抽取单元用于根据文本向量对待处理文本信息整合获得文本摘要;标签要素抽取单元用于根据文本向量从待处理文本中抽取标签并采集指标数据,根据标签和指标数据获得文本指标数据信息;智能文本推荐单元用于根据文本向量从待处理文本中确定推荐文本;情感意图分析单元用于根据文本向量确定待处理文本的情感倾向和文本的意图类别。该方案能满足多种应用场景。
-
公开(公告)号:CN113554223A
公开(公告)日:2021-10-26
申请号:CN202110820897.2
申请日:2021-07-20
Applicant: 航天信息股份有限公司
Abstract: 一种获得税收预测结果的方法、装置及电子设备,该方法包括:根据获取到的基础特征、生成特征、组合特征生成初始特征组,初始特征组经过预设规则进行筛选,得到训练特征组,将所述训练特征组输入指定训练模型,得到税收预测模型,在预测模型中输入税收的特征数据,得到预测结果。通过上述方法,将不同特征选择优势相互结合,筛选出大量无效特征,并删除无效特征,提高了预测结果的精度。
-
公开(公告)号:CN112241914A
公开(公告)日:2021-01-19
申请号:CN202011063041.7
申请日:2020-09-30
Applicant: 航天信息股份有限公司
IPC: G06Q40/00
Abstract: 本公开涉及一种企业的评估方法、装置、存储介质和电子设备,针对多个待评估企业中的每一个待评估企业,基于该待评估企业的税务数据中不同的业务数据信息,对该待评估企业建立至少两个不同的关联企业网络,并确定出该待评估企业在每个所述关联企业网络中的权重;根据该待评估企业在每个所述关联企业网络中的权重,对该待评估企业的至少两个不同的关联企业网络进行自适应网络融合处理,获取该待评估企业的网络融合后的数据信息;利用该待评估企业的网络融合后的数据信息通过随机游走模型,得到所述该待评估企业的重要性权重;根据每个所述待评估企业的重要性权重,对所述多个待评估企业进行评估。本公开用以提高企业重要性评估的准确性。
-
公开(公告)号:CN109829614A
公开(公告)日:2019-05-31
申请号:CN201811604420.5
申请日:2018-12-26
Applicant: 航天信息股份有限公司
Abstract: 本发明公开了一种基于靶标模型的食品风险量化分级方法及系统,所述方法包括:获取食品的检测数据,根据检测数据所属的分类将所属检测数据划分至预设的多个指标内;计算每个指标的不合格率以及平均不合格度;根据每个指标下的不合格率和不合格度,使用预设的靶标模型计算对应指标的风险等级;输出各个指标的风险等级,并对所述各个指标的风险等级根据预设规则进行预警;所述方法及系统通过对多样性的食品检测数据进行融合形成多个指标,通过靶标模型的建立对各指标的进行评价,获得食品风险量化分级,以实现食品风险程度的定量刻画,直观反映食品的安全概况,可帮助食品安全领域人员提升认知和分析能力,提高食品安全监管的科学性和有效性。
-
公开(公告)号:CN109783532A
公开(公告)日:2019-05-21
申请号:CN201811519584.8
申请日:2018-12-12
Applicant: 航天信息股份有限公司
IPC: G06F16/2458 , G06F16/248
Abstract: 本公开涉及一种基于微服务架构的食品/药品分析方法和系统,属于食品与药品数据分析技术领域。其中,所述方法包括:按照提供的检索项目和分析维度项目生成数据请求;按照所述分析维度采集符合所述检索项目的数据;按照设定的统计算法对采集到的数据进行计算得到结果数据,和输出所述结果数据。本公开不仅从多个维度反映了食品与药品的质量安全概况,而且可帮助食品/药品安全领域人员全面了解数据的分布态势。本公开采用微服务的架构,使得前后端解耦,实现了并行开发、自动化测试以及独立部署,不仅提升了开发效率,增强了代码可维护性,而且能更好地应对复杂多变的前端需求。
-
公开(公告)号:CN117667206A
公开(公告)日:2024-03-08
申请号:CN202311714726.7
申请日:2023-12-13
Applicant: 航天信息股份有限公司
IPC: G06F9/30 , G06F18/214
Abstract: 本申请实施例提供了一种数据扩充方法、装置、电子设备及存储介质,该数据扩充方法包括:获取多个第一数据组,第一数据组包括第一指令、第一指令对应的参考数据和第一指令对应的结果数据;根据多个第一数据组中的第一指令,生成多个第二指令;根据各第二指令的指令类型,确定该第二指令对应的至少一个第二数据组,第二指令对应的第二数据组包括该第二指令、该第二指令对应的参考数据和该第二指令对应的结果数据,指令类型不同的任意两个第二指令对应的数据确定顺序不同;将多个第一数据组和多个第二数据组均确定为扩充后数据组。本方案使扩充后数据组较为多样化,以优化基于扩充后数据组进行模型训练的效果。
-
公开(公告)号:CN117609736A
公开(公告)日:2024-02-27
申请号:CN202311774771.1
申请日:2023-12-21
Applicant: 航天信息股份有限公司
IPC: G06F18/20 , G06N3/0464 , G06N3/0442 , G06N3/08 , G06F18/15
Abstract: 本申请实施例提供了一种粮温预测方法、装置、电子设备及存储介质,该粮温预测方法包括:获取多个原始数据组,其中,原始数据组包括在对应的周期内目标粮仓中多个测温点对应的测量温度值,不同的原始数据组对应的周期不同;将对应的周期内目标粮仓处于非空仓状态的原始数据组作为第一数据组;根据多个第一数据组,确定至少一个第二数据组,其中,第二数据组包括在对应的周期内目标粮仓中多个测温点对应的预测温度值,不同的第二数据组对应的周期不同,多个第二数据组对应的周期中首个周期的开始时间,为多个原始数据组对应的周期中最后一个周期的结束时间,或者在结束时间之前。本方案可以使粮温预测更加可靠且更加准确。
-
公开(公告)号:CN111209746B
公开(公告)日:2024-01-30
申请号:CN201911401196.4
申请日:2019-12-30
Applicant: 航天信息股份有限公司
IPC: G06F40/284
Abstract: 本公开涉及一种自然语言处理方法、装置、存储介质及电子设备,所述方法包括:接收待分析文本数据和分析指令,分析指令用于指示对待分析文本数据进行的分析模式和分析结果格式;若分析模式指示对待分析文本数据进行句法依存分析,则对待分析文本数据进行分词处理,获得分词数据;根据分词数据对待分析文本数据进行词性标注,获得分词词性数据;对分词词性数据中的名词词性的分词词语进行实体识别,获得实体识别数据;根据分词词性数据和实体识别数据进行句法依存分析,获得句法依存数据;根据分析结果格式确定文本数据分析结果,输出文本数据分析结果,文本数据分析结果包括分词数据、分词词性数据、实体识别数据和句法依存数(56)对比文件袁里驰.基于依存关系的句法分析统计模型.中南大学学报(自然科学版).2009,(第06期),164-169.
-
-
-
-
-
-
-
-
-