-
公开(公告)号:CN101201816B
公开(公告)日:2010-10-13
申请号:CN200710179917.2
申请日:2007-12-20
Applicant: 北大方正集团有限公司 , 北京方正阿帕比技术有限公司 , 北京大学
Abstract: 本发明公开了一种将数据流中的数据输出到XML文件中的适配器及方法,属于数据库ETL领域。在现有技术中,SQL Server 2005集成服务的数据流任务中没有提供一种功能可以直接把数据流中的数据输入到一个XML文件中。利用本发明所述的适配器及方法,用户可以通过事先按照一定格式生成的目标XML文件的说明模版,把从数据流任务管道中得到的数据输出到目标XML文件中。采用本发明所述的适配器及方法可以灵活有效的把数据流任务管道中的数据按照指定格式输出到目标XML文件中。
-
公开(公告)号:CN118780287A
公开(公告)日:2024-10-15
申请号:CN202310365798.9
申请日:2023-04-07
Applicant: 北京大学
IPC: G06F40/30 , G06F40/194 , G06F16/335 , G06F16/34 , G06N20/00
Abstract: 本发明涉及一种文本的语义匹配方法和系统。该方法的步骤包括:根据基于规则的粗筛算法从备选文本中得到待匹配文本;将目标文本使用摘要算法生成长度合适的文本作为匹配目标;采用基于提示学习的文本匹配方法,计算匹配目标和待匹配文本之间的语义相似度,语义相似度的排序结果即为匹配结果。本发明可以匹配长度不同、甚至非常悬殊的两段文本,可以实现高精度和高召回的匹配性能;对于大规模的待匹配文本,本发明通过两阶段的方式来同时保证结果精度和时间效率。
-
公开(公告)号:CN101373504B
公开(公告)日:2012-02-01
申请号:CN200810117723.4
申请日:2008-08-04
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正阿帕比技术有限公司
Abstract: 本发明涉及一种控制数字内容下载设备个数的方法和系统,属于数字版权保护领域。现有数字版权保护的数字内容文件阅读往往只限于在一个设备上进行阅读,当要在其它设备上下载应用时需要重新下载而占用资源的下载次数或复本数。本发明包括客户端子系统和服务器端子系统,而服务器端子系统主要由五个核心模块组成:下载请求处理模块、用户管理模块、下载设备管理模块、用户下载控制模块和下载内容许可发放模块组成。采用本发明所述的方法,进行一次数字内容交易时,允许用户可以在同一台设备上进行多次下载,也允许在一定数量的不同设备上下载。
-
公开(公告)号:CN101201816A
公开(公告)日:2008-06-18
申请号:CN200710179917.2
申请日:2007-12-20
Applicant: 北大方正集团有限公司 , 北京方正阿帕比技术有限公司 , 北京大学
Abstract: 本发明公开了一种将数据流中的数据输出到XML文件中的适配器及方法,属于数据库ETL领域。在现有技术中,SQLServer2005集成服务的数据流任务中没有提供一种功能可以直接把数据流中的数据输入到一个XML文件中。利用本发明所述的适配器及方法,用户可以通过事先按照一定格式生成的目标XML文件的说明模版,把从数据流任务管道中得到的数据输出到目标XML文件中。采用本发明所述的适配器及方法可以灵活有效的把数据流任务管道中的数据按照指定格式输出到目标XML文件中。
-
公开(公告)号:CN118012994A
公开(公告)日:2024-05-10
申请号:CN202211406508.2
申请日:2022-11-10
Applicant: 北京大学 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/2458 , G06F18/22 , G06N5/02 , G06N3/045
Abstract: 本发明公开了一种基于理论知识库的搜索和问答系统,包括预计算模块、分流模块、模搜索模块、知识点提取模块、知识点问答类问询的意图识别模块、理论盘点类问询的知识点及场景提取模块、回答生成模块;输入与预计算模块用于计算理论知识库中每一个知识点的向量并存储;分流模块用于将收到的问询分成四类:模糊搜索类问询、知识点问答类问询、理论盘点类问询;所搜索模块用于根据所述问询构建对应的问询向量,在理论句子向量库中搜索与所述问询向量匹配的理论句子返回输出;知识点提取模块用于从所述问询中抽取关键词,以及将所述问询中的每一关键词映射到所述理论知识库中匹配的知识点;回答生成模块用于基于匹配的知识点和场景生成回复信息。
-
公开(公告)号:CN115221335A
公开(公告)日:2022-10-21
申请号:CN202210729506.0
申请日:2022-06-24
Applicant: 北京大学
IPC: G06F16/36 , G06F40/194 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种知识图谱的构建方法,其步骤包括:1)在没有标注的政治理论语料文本上自动抽取政治理论知识;2)对政治理论知识进行筛选和标注;3)利用训练文本训练政治知识抽取模型;4)使用训练后的政治知识抽取模型对语料库进行知识抽取,得到政治理论知识;5)对于任意两个政治理论知识,计算二者在所述语料库的共现度和语义相似度,如果共现度或语义相似度不为零,则在该两个政治理论知识之间连接一条边,从而得到语料库对应的知识图谱;6)将专家标注的带上下位结构的知识体系与步骤5)所生成的知识图谱进行知识对齐,将知识体系中专家标注的主题词之间的上下位关系融入所述知识图谱。本发明解决了无法抽取较长概念的问题。
-
公开(公告)号:CN101373504A
公开(公告)日:2009-02-25
申请号:CN200810117723.4
申请日:2008-08-04
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正阿帕比技术有限公司
Abstract: 本发明涉及一种控制数字内容下载设备个数的方法和系统,属于数字版权保护领域。现有数字版权保护的数字内容文件阅读往往只限于在一个设备上进行阅读,当要在其它设备上下载应用时需要重新下载而占用资源的下载次数或复本数。本发明包括客户端子系统和服务器端子系统,而服务器端子系统主要由五个核心模块组成:下载请求处理模块、用户管理模块、下载设备管理模块、用户下载控制模块和下载内容许可发放模块组成。采用本发明所述的方法,进行一次数字内容交易时,允许用户可以在同一台设备上进行多次下载,也允许在一定数量的不同设备上下载。
-
公开(公告)号:CN101187966A
公开(公告)日:2008-05-28
申请号:CN200710301750.2
申请日:2007-12-26
Applicant: 北大方正集团有限公司 , 北京方正阿帕比技术有限公司 , 北京大学
IPC: G06F21/24
Abstract: 本发明公开了一种数字版权保护方法及系统,涉及信息安全中数字版权保护方法及系统,解决了现有技术中用户在没有密钥时,不能预先得知数字内容中的基本信息的问题。该数字版权保护方法及系统是针对条目数据中的关键数据项进行加密,而条目数据中的基本数据项不进行加密,这样用户在没有密钥时可以通过基本数据项来了解数字内容的基本信息,以便决定是否购买许可证来获取密钥。本发明数字版权保护方法主要用在字典、百科全书、年鉴等具有条目数据的数字内容的版权保护中。
-
-
-
-
-
-
-