-
公开(公告)号:CN108009219A
公开(公告)日:2018-05-08
申请号:CN201711166896.0
申请日:2017-11-21
Applicant: 国家计算机网络与信息安全管理中心 , 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种发现互联网金融舆情监管目标的方法,涉及互联网金融大数据领域。所述方法包括:实时获取备选互联网金融企业的网站地址,并将所述网站地址存储在网页待解析库中;对网页待解析库中新增的网站地址所对应的网页解析,得到备选互联网金融企业的名称,将验证成功后的名称作为互联网金融企业监测目标,完成发现互联网金融舆情监管目标。本发明所述方法自动发现互联网金融企业目标,找到其对应的网站地址,通过初期配置后自循环发现,不需要长期人工干预,通过长期运行有效地发现新增互联网金融企业目标。
-
公开(公告)号:CN113761215A
公开(公告)日:2021-12-07
申请号:CN202110321491.X
申请日:2021-03-25
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 赵忠华 , 李建广 , 余智华 , 王禄恒 , 陈欣洁 , 赵志云 , 冯凯 , 葛自发 , 杜漫 , 孙小宁 , 穆庆伟 , 万欣欣 , 申双成 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本发明公开了一种基于反馈自学习的动态字典库生成方法,包括以下步骤:S1、字典库定义;S2、基于字典库分类体系;S4、基于语料库导出的标注数据,配合模型参数调整,逐步迭代优化模型;S5、将S4步生成的预测数据回填到字典库。有益效果:该方法通过概念模式定义、自然语言处理技术、全流程调度机制,实现从原始语料概念模式定义生成基础字典库,在基础字典库基础上进行标注模型的自动构建、迭代训练及修正,最后再利用标注模型来进行新的语料数据标注,反馈更新字典库,实现从标注训练到反馈自学习的闭环流程,达到模型自动逐步优化能力。最终实现字典库的自动完善,标注模型逐步优化的全自动循环过程。
-
公开(公告)号:CN112131863B
公开(公告)日:2022-07-19
申请号:CN202010772735.1
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/216 , G06F40/242 , G06F16/35 , G06F40/35
Abstract: 本发明提供了一种评论观点主题抽取方法,包括:采集社交软件中评论,获得评论文本;对所述评论文本进行预处理,将评论文本转换为词向量,形成文本向量;构建观点句分类模型,判断所述评论文本中的句子是否为观点句;聚类所述观点句形成观点主题簇,分别抽取所述观点主题簇中的关键词作为候选观点关键词;在所述候选观点关键词中抽选关键词,并根据词性选择核心词;将与所述核心词匹配的观点句生成主题,形成主题候选集;从每个类别的所述主题候选集中选择一个主题作为最终观点主题。本发明还提供了电子设备和存储介质。从评论文本自动抽取观点主题,以便准确接收网民意见,并判断是否对社会造成舆论,能够直观地了解到社交软件的相关热点话题。
-
公开(公告)号:CN112130895B
公开(公告)日:2022-04-15
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130851B
公开(公告)日:2022-04-15
申请号:CN202010772703.1
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供了一种用于人工智能的建模方法,包括以下步骤:模型初始化:接收新建模块组件指令或编辑模块组件指令,生成菜单组件和视图组件;算子组件构建:接收选择算子标识的指令;接收复制指令;接收生成位置指令;在所述位置建立算子组件,所述算子组件抽取算子标识携带的信息;连线构建:判断连线输出节点,判断连线输入节点,在连线输出节点和连线输入节点之间构建有向连线;运行验证:接收运行指令,将数据沿有向连线在算子组件之间进行传递,将正在执行的算子组件进行突出显示,在算子组件上显示运行结果。本发明还提供了一种电子设备、存储介质,将创建模型的过程可视化,便于查看模型的结构、数据流向、执行、运行结果。
-
公开(公告)号:CN113761885A
公开(公告)日:2021-12-07
申请号:CN202110283749.1
申请日:2021-03-17
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/263 , G06F40/289 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于BayesLSTM的语种识别方法,包括以下步骤:S1、构建词向量模型;S2、词向量作为输入,输入到LSTM中;S3、通过概率密度分布来对权重进行采样,优化分布参数;S4、通过Softmax分类器对经过贝叶斯优化的特征向量进行预测分类;S5、根据步骤S4的预测分类概率,最终得到文本的分类类别标签。有益效果:本发明的方法通过估计模型参数的不确定性来提高模型的鲁棒性和语种识别的准确率。
-
公开(公告)号:CN113761290A
公开(公告)日:2021-12-07
申请号:CN202110260410.X
申请日:2021-03-10
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/901 , G06F16/903
Abstract: 本发明公开了一种基于SQL实现全文检索图数据库的查询方法及查询系统,包括以下步骤:S1、建立sql查询系统和图查询系统的映射关系;S2、建立sql查询系统的查询用户和图查询系统的用户映射关系;S3、建立sql查询系统中表和图查询系统中的节点、边等对象的对应关系;S4、将查询中涉及到图节点关系的查询下发图数据库执行,针对图数据库查询返回的记录通过SQL全文检索,向用户返回满足条件的记录。本发明的有益效果为:可以将图数据库,关系数据库存储的数据一起关联查询,减轻用户开发系统的负担。
-
公开(公告)号:CN113760877A
公开(公告)日:2021-12-07
申请号:CN202110337239.8
申请日:2021-03-10
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/215 , G06F16/242 , G06F16/2455
Abstract: 本发明公开了一种基于标准SQL的流式数据清洗转换方法和系统,根据本发明的一方面包括以下步骤:S1、系统初始化,针对系统库、工作线程、Groovy函数线程、SQL解析引擎进行初始化操作;S2、在上述初始化完成以后,系统开始进行数据清洗转换的工作。根据本发明的另一方面还包括系统初始化模块、内置算子库、SQL解析引擎、提交SQL模块、提交Groovy模块、Groovy类初始化模块、Groovy执行模块、数据重组模块、数据输入和输出模块。本发明的有益效果为:更加高效、便捷、灵活地对流式数据清洗、转换,筛选符合条件的数据,让数据对用户更加有价值。
-
公开(公告)号:CN112130895A
公开(公告)日:2020-12-25
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130812A
公开(公告)日:2020-12-25
申请号:CN202010772705.0
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。
-
-
-
-
-
-
-
-
-