-
公开(公告)号:CN103853772B
公开(公告)日:2017-02-08
申请号:CN201210511478.1
申请日:2012-12-04
Applicant: 北京拓尔思信息技术股份有限公司
Inventor: 王弘蔚
IPC: G06F17/30
Abstract: 本发明公开了一种高效倒排索引组织方法。将记录倒排项和属性倒排项分开存储,减少信息冗余;采用分块方式对倒排索引进行存储,以数据库索引优化为切入点,综合利用链表和集中定位表的优势对倒排块进行管理,既有利于索引动态维护又便于SKIP技术下的随即访问;同时根据域间关联关系,采用了压缩技术,以达到尽量少的空间存储尽量多的信息量。所提供的倒排索引结构及组织方法,减少了存储空间、优化了访问时间,在一定程度解决了倒排索引优化问题,能够实现海量数据的有效管理。
-
公开(公告)号:CN105592003A
公开(公告)日:2016-05-18
申请号:CN201410563541.5
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供一种基于通知的跨域单点登录方法,其包括:步骤S1.信任通道建立;步骤S2.全局认证凭证生成;步骤S3.用户身份认证;步骤S4.单点登录。借助web服务器的原有会话机制,以安全的加密通道传递会话ID,在认证服务端维护会话ID与认证凭证的关系,实现身份认证和单点登录,具有效率高、安全性高、实现成本低的特点。此外,本发明还提供一种基于通知的跨域单点登录系统,包括:客户端、应用服务端、认证中心三大模块,任意接入认证中心的应用端需携带重定向组件,认证中心负责认证凭证的生成、管理、销毁等工作,应用服务端与认证中心需建立互信通道,复用web服务的会话特性,实现跨域单点登录,具有复杂度低、安全性高、可靠性强的优点。
-
公开(公告)号:CN105302793A
公开(公告)日:2016-02-03
申请号:CN201510696274.3
申请日:2015-10-21
Applicant: 南方电网科学研究院有限责任公司 , 中国南方电网有限责任公司电网技术研究中心 , 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供了一种利用计算机自动评价科技文献新颖性的方法,其包括如下步骤:A、基于文档内容排序的新颖性检测;B、基于文档语义比对的新颖性检测;C、基于关键术语的新颖性检测;D、基于数值指标的新颖性检测;E、基于步骤A-D分别得到各自的新颖性评分,运用回归模型计算出查新文档的新颖性总分。采用本发明的方法,可基于多维度新颖性检测的科技文献自动查新,提高科技查新的效率。
-
公开(公告)号:CN104750461A
公开(公告)日:2015-07-01
申请号:CN201310723625.6
申请日:2013-12-25
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F9/44
Abstract: 本发明提供一种可视化的网站建设系统,其包括:站点池,栏目库,资源池,风格池,母版库,可视化设计页面等模块,其中可视化设计页面作为用户接口,将网页拆分成一个个独立的资源块,由其他数据资源模块提供内容、风格支持,可实现用户拖拽设计和可视化数据配置。此外,本发明还提供一种可视化的网站建设方法,该方法将站点池、栏目库以结构树的形式组织管理,预定义资源池、风格池内容,页面设计时直接选择资源块并配置资源块的内容及风格即可,实现了所见即所得的网站建设模式,同时将内容与表现形式剥离,业务处理逻辑透明化,提高了网站建设效率,降低了网站建设的技术门槛。
-
公开(公告)号:CN104679738A
公开(公告)日:2015-06-03
申请号:CN201310607937.0
申请日:2013-11-27
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供的一种互联网热词挖掘方法,包括:词图和背景库的初始化;实体串和非实体串的识别;字串统计指标更新;字串热度计算;字串热度排序及字串输出。将字串分为实体串和非实体串有针对性的区分识别,并设置背景库实现语料和计算指标的增量更新,提高了热词抽取的准确率和效率。同时,还提供了一种互联网热词挖掘装置,包括:存储单元,实体串识别单元,非实体串识别单元,热词抽取单元。热词抽取单元完成:统计指标的增量更新,字串热度计算,字串排序输出。实现热词有序、高效、准确地抽取。
-
公开(公告)号:CN103793421A
公开(公告)日:2014-05-14
申请号:CN201210428272.2
申请日:2012-10-31
Applicant: 北京拓尔思信息技术股份有限公司
Inventor: 都云程
IPC: G06F17/30
Abstract: 本发明公开了一种基于网页结构的信息动态采集更新调度方法,该方法包括:S1,采用网页结构分析方法对每个采集后的网页进行量化打分;S2,页面分数大于一定阈值()判定为Hub页面,参与更新采集调度;S3,将Hub页面分数划定等级,不同等级采用不同的调度周期实施调度;S4,每轮采集后,重新调整Hub页面调度等级,在持续调整过程中实现更新采集效果的不断优化。本发明实现了海量信息时代下,信息采集系统准确、高效的要求。
-
公开(公告)号:CN105592003B
公开(公告)日:2019-08-09
申请号:CN201410563541.5
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供一种基于通知的跨域单点登录方法,其包括:步骤S1,信任通道建立;步骤S2,全局认证凭证生成;步骤S3,用户身份认证;步骤S4,单点登录。借助web服务器的原有会话机制,以安全的加密通道传递会话ID,在认证服务端维护会话ID与认证凭证的关系,实现身份认证和单点登录,具有效率高、安全性高、实现成本低的特点。此外,本发明还提供一种基于通知的跨域单点登录系统,包括:客户端、应用服务端、认证中心三大模块,任意接入认证中心的应用端需携带重定向组件,认证中心负责认证凭证的生成、管理、销毁等工作,应用服务端与认证中心需建立互信通道,复用web服务的会话特性,实现跨域单点登录,具有复杂度低、安全性高、可靠性强的优点。
-
公开(公告)号:CN109753581A
公开(公告)日:2019-05-14
申请号:CN201811452179.9
申请日:2018-11-30
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F16/583 , G06F16/51 , G06N3/04 , G06K9/46 , G06K9/62
Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:提取图像的具有第一维度的第一特征数据;对所述第一特征数据进行特征降维,获得具有第二维度的第二特征数据,所述第二维度的值小于第一维度的值;根据与所述第二维度的各个特征数据预设的阈值,对所述第二特征数据的各个维度的特征值进行二进制编码,生成表征图像基因的二进制串码;将所述二进制串码中各个对应单位位数的值映射为字符,获得表征图像基因的编码字符串。这种图像特征基因编码方法快速、简单,能够使用相对少的计算资源进行计算,具有极佳的领域适用性。
-
公开(公告)号:CN109741394A
公开(公告)日:2019-05-10
申请号:CN201811506464.4
申请日:2018-12-10
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06T7/62
Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个图像边界遍历所述二值化图像,获取与所述非空白图像区域的轮廓相切的多条边切线,所述边切线上包含至少一个黑色像素点且其一侧仅包含白色像素点;根据获取的多条边切线,获取至少一个外接矩形;将多个外接矩形当中面积最小的外接矩形选取为所述非空白图像区域的最小外接矩形区域。能够相对容易地计算得到图像的最小外接矩形,并且降低最小外接矩形的计算复杂度。
-
公开(公告)号:CN105590082B
公开(公告)日:2019-02-22
申请号:CN201410563687.X
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 文档图像识别方法,包括图像预处理、获取图像连通区域、连通区域特征抽取、文档图像判别,图像连通区域的获取借助了聚类的思想,应用8连通准则,对灰度值为0和255的像素点分别聚类,准确识别连通区域。连通区域特征包括形状特征、颜色特征,主要分三种方式抽取,依次为疑似字符识别、一致性字符发现、真实字符判断,特征抽取简洁、复杂度低。实现了文档图像的准确、高效的识别,解决了文档图像识别性能低下的问题。
-
-
-
-
-
-
-
-
-