Patent search ap:("北京赛思信安技术股份有限公司") AND inv:"周游" Page 2

11.

发明授权
一种针对海量数据全文检索场景的实现方法有权

公开(公告)号：CN106649462B

公开(公告)日：2019-11-08

申请号：CN201610849788.2

申请日：2016-09-26

Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王宇 , 徐晓燕 , 周渊 , 吴小伟 , 刘庆良 , 王振宇 , 郑彩娟 , 李斌斌 , 黄成 , 周游

IPC: G06F16/31 , G06F16/33

Abstract: 本发明提供了一种针对海量数据全文检索场景的实现方法，属于海量数据全文检索领域。本发明将Lucene引入检索引擎，对集群中已经存在的数据文件建立Lucene索引文件。在每个存储Lucene索引文件的节点上，设置有一个守护进程对该节点的Lucene索引文件进行维护。本发明优化协调器对fragment的调度机制，对每个执行节点进行计数判断，调整每个fragment的执行位置，以均衡节点资源。本发明还优化全文读取引擎机制，优先采用Lucene进行检索，当出现问题时调用RCFile检索，以保证检索的持续性和正确性。本发明提高了检索性能，可更加合理地利用集群的资源。

12.

发明授权
一种基于消息推送模式的跨地域数据同步方法有权

公开(公告)号：CN105472024B

公开(公告)日：2018-09-28

申请号：CN201511001080.3

申请日：2015-12-28

Applicant: 北京赛思信安技术股份有限公司

Inventor： 王振宇 , 周游

IPC: H04L29/08

Abstract: 本发明提供了一种基于消息推送模式的跨地域数据同步方法，用于实现对不同数据中心的数据进行异地备份和恢复，属于海量数据管理领域。本方法在各数据中心配置集群内各数据中心消息组件部署的IP地址，采用推送方式来传输消息；针对不同的数据中心设置异地配置策略，设置需要同步的数据中心或数据中心的组合；底层传输采用HTTP协议和自定义序列化反序列化框架；最后基于消息组件实现数据的同步或更新、恢复以及移除，在实现时采用错误重试机制。本发明可实现消息的实时传递和处理，实现对一个点、多个点同时的数据推送、恢复和删除，确保更新、删除后的数据一致性，保证数据的跨地域同步的可靠性和安全性。

13.

发明公开
出的多语言分词，在增强海量数据文本分类、文一种基于词典与文法分析的多语种分词方本信息提取、自动摘要等文本分词领域具有广泛法的应用前景。审中-实审

公开(公告)号：CN106528536A

公开(公告)日：2017-03-22

申请号：CN201611001691.2

申请日：2016-11-14

Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王宇 , 徐晓燕 , 周渊 , 刘庆良 , 郑彩娟 , 黄成 , 王海平 , 周游 , 陈婷婷

IPC: G06F17/27

CPC classification number: G06F17/2765 , G06F17/2705

Abstract: 本发明公开一种基于词典与文法分析的多语种分词方法，可以实现中、日、韩、粤语等混合文本高效准确的分词处理，并且对于不同时段、不同专业的词可以实现灵活的词库扩展，有效更新词库信息，实现准确、高效的多语种语言文本分词；通过内嵌中日韩粤等语系子分词器、中文量子分词器和西方语系分词器，可以实现每类语种文本判断的准确分词；通过内置的语言片段编码识别机制字段对待分词文本片段进行切分，切分后的每种文本片段对应于一种语系，并使用相应的子分词器进行分词；通过文法分析可以实现西方屈折语的分词、中、日、韩、粤语的smart模式分词，可以处理含有阿拉伯数字信息的文本；同时，本发明还可以实现多种语言混合的文本分词，脱离了分词工具只能对单一语种、个别几个语种分词的局限性，保证文本分词的安全性、准确性、高效性、灵活性、普适性。通过本发明的提

14.

发明公开
一种基于编码和机器学习的多语种识别方法有权

公开(公告)号：CN106528535A

公开(公告)日：2017-03-22

申请号：CN201611001398.6

申请日：2016-11-14

Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王宇 , 徐晓燕 , 周渊 , 刘庆良 , 郑彩娟 , 王海平 , 黄成 , 周游 , 陈婷婷

IPC: G06F17/27

CPC classification number: G06F17/275

Abstract: 本发明提供了一种基于编码和机器学习的多语种识别方法，是计算机对自然语言的处理技术。本方法分别通过机器学习单元和编码识别单元对文本进行语种识别，编码识别时还统计各语种的单词量，当机器学习单元的识别结果在编码识别单元的判定区间内，且二者识别的语言一致时，输出单一识别语言，当编码识别单元识别到多种语言时，进行混合语言规则判断，若第二语言在文本中的单词量比例达到设定比例，则判定文本为混合语言。本发明对长文本可先作随机采样再判定，以提高识别效率。本发明能够准确、高效地实现中文简繁体、日、法、英等99种语言的语种识别，同时支持混合语种文本识别，在海量数据分析以及舆情监控中具有广泛的应用前景。

15.

发明公开
一种基于消息推送模式的跨地域数据同步方法有权

公开(公告)号：CN105472024A

公开(公告)日：2016-04-06

申请号：CN201511001080.3

申请日：2015-12-28

Applicant: 北京赛思信安技术股份有限公司

Inventor： 王振宇 , 周游

IPC: H04L29/08

CPC classification number: H04L67/1095 , H04L67/02 , H04L67/26

Abstract: 本发明提供了一种基于消息推送模式的跨地域数据同步方法，用于实现对不同数据中心的数据进行异地备份和恢复，属于海量数据管理领域。本方法在各数据中心配置集群内各数据中心消息组件部署的IP地址，采用推送方式来传输消息；针对不同的数据中心设置异地配置策略，设置需要同步的数据中心或数据中心的组合；底层传输采用HTTP协议和自定义序列化反序列化框架；最后基于消息组件实现数据的同步或更新、恢复以及移除，在实现时采用错误重试机制。本发明可实现消息的实时传递和处理，实现对一个点、多个点同时的数据推送、恢复和删除，确保更新、删除后的数据一致性，保证数据的跨地域同步的可靠性和安全性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification