-
公开(公告)号:CN110674328A
公开(公告)日:2020-01-10
申请号:CN201910925718.4
申请日:2019-09-27
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及一种商标图像检索方法、系统、介质及设备,该方法包括:按照每个商标分类号的所有类似群号对包含商标图像的特征向量的特征库进行分库;按照确定的聚类中心的数量对每个所述分库中的商标图像的特征向量进行聚类,在每个所述分库中为属于同一个聚类簇的特征向量划分一个子库;根据待查询商标的分类号和商标图像确定所述待查询商标所属子库;计算所述待查询商标的商标图像的特征向量与所属子库中商标图像的特征向量之间的距离;输出距离最小的前N个商标图像的特征向量对应的商标作为检索结果。本发明可大幅减少线上检索时的搜索范围,尤其当向量维度较高时,可以显著提高检索效率。
-
公开(公告)号:CN106372051B
公开(公告)日:2019-05-03
申请号:CN201610916401.0
申请日:2016-10-20
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及一种专利地图的可视化方法和系统,该方法包括:获取专利文献数据集中每个专利文献对应的多维文本向量;对每个专利文献对应的多维文本向量进行聚类分析,得到多个聚类结果;将每个聚类结果对应的多个专利文献映射到二维平面,以进行降维处理并得到专利文献数据点;将多个专利文献数据点进行可视化计算,生成可视化数据,并将可视化数据在二维平面上显示成三维图像。本发明提供的一种专利地图的可视化方法和系统,能够简化专利地图生成过程中的运算量,从而减少对对CPU和内存的开销,实现实时生成专利地图并展现。
-
公开(公告)号:CN109145125A
公开(公告)日:2019-01-04
申请号:CN201810948268.6
申请日:2018-08-20
Applicant: 长城计算机软件与系统有限公司
IPC: G06F16/383 , G06F17/27
CPC classification number: G06F17/2705
Abstract: 本发明实施例涉及一种动态抽取信息的方法和系统、存储介质,属于信息处理技术领域。该方法包括:对获取到的目标文本进行解析,得到目标文本对应的目标名称;从预设信息抽取规则中选取与目标名称相对应的目标信息抽取规则;根据目标信息抽取规则从目标文本中提取结构化信息。通过本实施例提供的:在对目标文本进行解析后,得到目标名称,根据目标名称从预设信息抽取规则中选取目标信息抽取规则,根据目标信息抽取规则从目标文本中提取结构化信息的技术方案,避免了现有技术中通过人工的方式对结构化信息进行抽取时,造成的出错率高,效率低等技术弊端,实现了高效且精准的对结构化信息进行抽取的技术效果。
-
公开(公告)号:CN108092918A
公开(公告)日:2018-05-29
申请号:CN201711288661.9
申请日:2017-12-07
Applicant: 长城计算机软件与系统有限公司
IPC: H04L12/863 , H04L12/865 , H04L29/08 , G06F9/54 , G06F17/30
Abstract: 本发明实施例涉及一种消息传输方法和系统,属于数据处理技术领域。其中,该方法包括:将系统数据信息存储至数据库的第一事务中;在第一事务中,根据从数据库中调用的主键生成规则生成与系统数据信息对应的消息ID;根据消息ID和系统数据信息生成待处理消息;将待处理消息添加至分发队列中;根据预设的处理规则对分发队列中的待处理消息分别进行分发处理和/或路由处理。通过本实施例提供的技术方案,一方面,避免了现有技术中数据不一致的技术弊端;另一方面,实现了高效且精准的对消息进行传输的技术效果。
-
公开(公告)号:CN112200117B
公开(公告)日:2023-10-13
申请号:CN202011139730.1
申请日:2020-10-22
Applicant: 长城计算机软件与系统有限公司
IPC: G06V30/413 , G06V30/148 , G06V10/82 , G06V30/18 , G06V30/162 , G06V30/16 , G06N3/045 , G06N3/044 , G06N3/0464 , G06N3/08 , G06F40/174 , G06T11/60
Abstract: 本发明公开了一种表格识别方法及装置,涉及表格识别技术领域。该方法包括:获取包含待识别表格的图片,对图片中的表格的轮廓进行检测,根据检测结果得到表格中每个单元格的相对坐标;通过卷积递归神经网络对每个单元格内的文字进行识别,如果识别失败,则通过渐进尺度扩展网络对识别失败的单元格内的文字进行识别;识别完成后,根据识别结果确定每个单元格的内容,根据每个单元格的相对坐标确定每个单元格的相对位置,生成表格文件。本发明不需要对样本数据进行字符分割,可识别任意长度的文本序列,模型速度快、性能好,并可以成功地识别相邻文本实例,从而提高识别的准确度和精确度。
-
公开(公告)号:CN115935134A
公开(公告)日:2023-04-07
申请号:CN202211493252.3
申请日:2022-11-25
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及用于统计出版物的数据处理设备、方法、装置和系统,该设备包括:统计出版物报表结构识别装置,对获取到的统计出版物图像中报表进行结构识别,并转化为可编辑的报表文件;报表单元格类别识别装置,识别所述报表文件中单元格内容所属的元数据类型进行识别;结构化数据存储装置,根据报表文件中单元格内容、单元格的类型、所述统计出版物图像中报表的结构,将报表中内容转化为结构化数据进行存储。本发明的方案能够智能提取宏观统计数据,在充分理解宏观统计数据含义的基础上,智能识别宏观数据的元数据信息,将宏观数据转化为结构化信息进行存储。
-
公开(公告)号:CN115828873A
公开(公告)日:2023-03-21
申请号:CN202211551807.5
申请日:2022-12-05
Applicant: 长城计算机软件与系统有限公司
IPC: G06F40/18 , G06F40/174
Abstract: 本发明公开了一种电子表单中表达式的设置方法和装置,属于数据统计技术领域,所述方法包括:拖拽表样设计界面中的组件、元数据信息,构建电子表单;响应于用户在所述表样设计界面中的第一操作,显示计算公式设置界面;响应于用户设置数据来源的第二操作;响应于用户对计算公式编辑框中各公式元素的第三设置操作,生成目标计算公式;目标计算公式类型包括:审核公式、运算公式、汇总公式、筛选公式中的至少之一。通过本发明公开的电子表单中表达式的设置方案,能够在表达式语法中引入匹配逻辑,使得几行或某几列共用一个表达式,将微观数据汇总成宏观数据的过程中,可避免重复编写表达式,提升工作效率。
-
公开(公告)号:CN115827871A
公开(公告)日:2023-03-21
申请号:CN202211690035.3
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/35 , G06N3/08 , G06F18/241 , G06N3/0464
Abstract: 本发明提供了一种互联网企业分类的方法和装置,其中该方法包括:S1:获取互联网企业的多维度数据,并对所述多维度数据预处理以生成长文本数据;S2:将所述长文本数据输入基于Transformer编码器的Bert网络模型进行处理;S3:将经过处理后的数据送入分类器来对所述互联网企业进行分类。本发明的方案基于在Transformer架构的深度神经网络中进行自动特征组合学习,能够对互联网企业准确进行行业分类,并能够极大提升互联网企业行业分类的准确率。本发明的方案能够快速将海量企业多维度信息进行识别,无需人工干预。本发明的方案基于大语料预训练模型加下游任务微调的方案能灵活应用在不同场景中海量企业的快速分类。
-
公开(公告)号:CN115757023A
公开(公告)日:2023-03-07
申请号:CN202211398686.5
申请日:2022-11-09
Applicant: 长城计算机软件与系统有限公司
IPC: G06F11/30
Abstract: 本发明提供了一种基于有限状态机的业务流程处理方法和装置以及用于业务处理的有限状态机模型,其中,该方法包括:S1:基于所述业务流程创建有限状态机模型,S2:根据输入数据和预设的状态转移规则来对所述有限状态机模型中的业务状态进行更新和切换,以执行与所述输入数据相对应的业务流程的处理。本发明的方案利用业务流程引擎工具,在Web端的可视化界面定制业务流程,并输入工作数据,即可维护和管理统计业务中的状态信息和转换逻辑,极大地降低了统计业务流程使用难度。另外本发明的方案对于系统的程序设计人员来说,当业务发生变化,业务流程和逻辑的修改工作量也会大幅减少,有效提高开发效率。
-
公开(公告)号:CN115544993A
公开(公告)日:2022-12-30
申请号:CN202211398681.2
申请日:2022-11-09
Applicant: 长城计算机软件与系统有限公司
IPC: G06F40/18 , G06F40/166
Abstract: 本发明公开了一种批量化修正Word表格的方法、装置、计算机设备及介质,该方法包括:加载至少一个Word文档;识别所述至少一个Word文档中的多个待修正Word表格;从预定义的Word表格风格中选定作为参考的Word表格风格,并按照选定的Word表格风格修正所述多个待修正Word表格。本发明可以避免专业人员手动逐个修正Word表格,节约了人力成本和时间成本,解决了Word文档中多个Word表格框以及Word表格框中文字的样式统一问题,实现了进行批量化的识别和纠正。通过本方法实现同时对多个Word表格框及Word表格框内包含的文字段落样式完成统一的属性设置,可以有效提高Word文档中Word表格对象样式的设置质量,做到统一化、规范化,同时还可减少人工审查带来的不确定性。
-
-
-
-
-
-
-
-
-