-
公开(公告)号:CN112541062A
公开(公告)日:2021-03-23
申请号:CN202011364569.8
申请日:2020-11-27
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/216 , G06F40/30
Abstract: 本公开涉及一种平行语料对齐方法、装置、存储介质及电子设备,所述方法包括:确定待对齐源文本和待对齐目标文本的初始化搜索范围对,并将所述初始化搜索范围对作为目标搜索范围对,在与所述目标搜索范围对对应的文本中确定目标对,确定目标对在待对齐源文本和待对齐目标文本中的位置序号,基于位置序号重新确定新的目标搜索范围对,并返回执行步骤所述在与所述目标搜索范围对对应的文本中确定目标对的步骤,直至得到的新的目标搜索范围对均为空,解决了相关技术中对齐效率较低的问题。
-
公开(公告)号:CN107622333B
公开(公告)日:2020-08-18
申请号:CN201711064205.6
申请日:2017-11-02
Applicant: 北京百分点信息科技有限公司
Abstract: 本申请公开了一种事件预测方法、装置及系统。方法包括:获取社交网络数据中的文本数据;对所述文本数据进行向量化处理,获取所述文本数据对应的特征向量;将所述特征向量输入至预建立的分类模型,所述分类模型用于以所述文本数据的特征向量为特征确定所述文本数据对应于可疑事件的概率。本申请通过抓取海量的社交网络数据,并对其中的文本数据进行自然语言处理,以从中找到作为关键影响因素的特征向量,并基于影响特征对文本数据进行预测,以达到准确预测可疑事件的目的。
-
公开(公告)号:CN111177180A
公开(公告)日:2020-05-19
申请号:CN201911264283.X
申请日:2019-12-11
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/242 , G06F16/2452 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种数据查询方法,用于解决采用现有技术中对于没有相关专业背景的用户来说,通常难以运用编程语言基于查询请求对SQL模板中的槽进行修改,得到结构化查询语句的问题。方法包括:确定目标模板;基于各待查询词与待查询数据库中各个字段、各个聚合函数的相似度,对目标模板包含的目标关键词和筛选项标识进行填充;其中,待查询词由自然语言描述的查询语句进行分词得到;基于填充后的目标模板从所述待查询数据库中查询目标数据。本申请还公开一种数据查询装置、数据查询电子设备及存储介质。
-
公开(公告)号:CN110019756A
公开(公告)日:2019-07-16
申请号:CN201910256399.2
申请日:2019-04-01
Applicant: 北京百分点信息科技有限公司 , 中国电子进出口有限公司
IPC: G06F16/332 , G06F16/335
Abstract: 本发明提供一种针对数据库提问的答案查询方法及装置,所述方法包括:获取针对所述数据库的第一提问对应的第一过滤条件和第一查询目标,以及,获取基于所述第一提问的第二提问对应的第二过滤条件和第二查询目标;将所述第一查询目标和所述第二查询目标进行合并,根据合并结果确定第三查询目标;根据所述第一过滤条件和所述第二过滤条件中的共有字段和非共有字段,生成第三过滤条件;其中,所述共有字段和非共有字段均为所述数据库中记录的字段;根据所述第三查询目标、所述第三过滤条件和所述数据库中记录的数据,确定所述第二提问对应的答案数据。通过本发明实施例可以解决现有技术在答案查询方法中无法基于任一个历史问题进行多轮提问的问题。
-
公开(公告)号:CN109828775A
公开(公告)日:2019-05-31
申请号:CN201811492741.0
申请日:2018-12-06
Applicant: 中国电子进出口有限公司 , 北京百分点信息科技有限公司
IPC: G06F8/70 , G06F16/28 , G06F16/2458 , G06F17/28
Abstract: 本发明公开了一种多语言翻译文本内容的WEB管理系统及方法,系统包括Neo4j数据库、Elastic Search搜索服务器、翻译文本内容管理服务器(包括工程创建模块、翻译词条创建模块和支持语言分类管理模块)、WEB前端、WEB APIs中心。本发明充分考虑了开发人员与翻译人员的工作习惯,利用程序解决了两者工作中涉及到的数据转换的问题。对于大量的翻译数据,本发明采用关系型数据库存储,保证的数据存储的安全性与高效性。系统设计上使用了方便的基于浏览器的WEB架构,方便使用,用户不需要特别配置,在线即用。
-
公开(公告)号:CN106021433B
公开(公告)日:2019-05-10
申请号:CN201610321688.2
申请日:2016-05-16
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明实施例提供一种商品评论数据的口碑分析方法及装置,包括:接收输入的待分析商品评论数据,并对所述待分析商品评论数据进行分句处理;当判定所述待分析商品评论数据中具有匹配所述规则文件的规则的子句时,则根据匹配的规则提取所述待分析商品评论数据的属性词和评价词;其中,所述规则文件是将待训练商品评论数据的属性种子词和评价种子词输入Boostrapp i ng算法得到的;判断所述属性词是否存在属性树文件中,判断所述评价词是否存在评价文件中;当判定所述属性词存在所述属性树文件中且所述评价词存在所述评价词文件中时,从聚类映射文件中匹配所述属性词和评价词对应的口碑数据,获得目标口碑数据。
-
公开(公告)号:CN109657072A
公开(公告)日:2019-04-19
申请号:CN201811523604.9
申请日:2018-12-13
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开了一种应用于政府辅助决策的智能搜索WEB系统及方法,充分考虑了政府决策相关数据的存储与结构,使用了针对性强的Elastic Search搜索服务器检索技术保证高效的在线分析效率,同时考虑到不同渠道数据的相关性,给出的政府决策分析结果数据更加全面综合。另外,本发明在系统设计上使用了方便的基于浏览器的WEB架构,方便使用,客户端不需要特别配置,在线即用。
-
公开(公告)号:CN106844682A
公开(公告)日:2017-06-13
申请号:CN201710056123.0
申请日:2017-01-25
Applicant: 北京百分点信息科技有限公司
IPC: G06F17/30
CPC classification number: G06F16/2471 , G06F16/27
Abstract: 本发明公开了一种数据交换方法、装置及系统,其中所述方法包括:获取一源数据库的日志文件;通过所述日志文件提取所述源数据库的操作记录,并将所述操作记录转换为预设格式的操作记录;根据所述预设格式的操作记录的字段将所述预设格式的操作记录写入对应的内存队列中,供目标系统从所述内存队列中提取预设格式的操作记录并执行。本技术方案可适用于多种类型的源数据库,无需开发人员或维护人员手动处理便可完成跨系统数据交换,具有扩展性好、对源数据库系统和目标数据库系统的资源占用少的优点。
-
公开(公告)号:CN106383764A
公开(公告)日:2017-02-08
申请号:CN201610800160.3
申请日:2016-08-31
Applicant: 北京百分点信息科技有限公司
CPC classification number: G06F11/3024 , G06F11/3037 , G06F17/30286
Abstract: 本发明公开了一种数据采集方法和设备,包括接收用户发送的数据采集信息,所述数据采集信息中包含待采集的数据类型和用于采集所述数据类型对应的系统资源数据的插件标识;根据预设的数据类型与用于采集所述数据类型对应的系统资源数据的插件标识之间的映射关系,匹配与所述数据采集信息中包含的所述待采集的数据类型对应的插件标识;调用所述插件标识对应的插件采集所述数据类型对应的系统资源数据;并将采集到的所述系统资源数据发送至数据库。这样,通过根据用户发送的数据采集信息调用对应插件,实现对服务器系统资源数据的采集,使用户能够方便地从数据库中获取到满足需求的系统资源数据,增加了数据获取的灵活性,提升了用户的使用体验。
-
公开(公告)号:CN103118111B
公开(公告)日:2017-02-08
申请号:CN201310039741.6
申请日:2013-01-31
Applicant: 北京百分点信息科技有限公司
IPC: H04L29/08
Abstract: 本发明公开了一种基于多个数据交互中心的数据进行信息推送的方法,包括:从多个数据交互中心获取用户行为数据和数据项信息数据,通过统一数据平台进行数据整合得到用户的特征数据;根据得到的所述用户特征数据及该用户的当前行为信息判断得到该用户的行为意图数据;根据所述用户的用户行为意图数据生成与该用户当前行为匹配的推荐信息;向该用户发送推荐信息。本发明解决了如何将多个数据交互中心的数据进行数据统一并发送个性化信息给用户的问题。
-
-
-
-
-
-
-
-
-