-
公开(公告)号:CN110580291B
公开(公告)日:2021-12-21
申请号:CN201910688857.X
申请日:2019-07-29
Applicant: 用友网络科技股份有限公司 , 北京大学
IPC: G06F16/36 , G06F16/903 , G06Q10/10 , G06Q10/06
Abstract: 本发明提出了一种基于ERP客户服务知识图谱的智能搜索方法及计算机设备,其中,基于ERP客户服务知识图谱的智能搜索方法包括:接收搜索字符串,解析搜索字符串的搜索信息;判断搜索信息是否在知识图谱的知识范围内;当判断结果为是的情况下,在知识图谱中匹配搜索信息所对应的知识条目;显示知识条目。本发明提出的基于ERP客户服务知识图谱的智能搜索方法,根据搜索字符串中的搜索信息,基于知识图谱计算和匹配对应的知识条目,再将搜索到的相关知识条目予以显示,从而实现智能搜索服务;可以准确、快速地将与搜索信息相关的知识作为搜索结果提供给用户,从而提高客户服务效率。
-
公开(公告)号:CN110580291A
公开(公告)日:2019-12-17
申请号:CN201910688857.X
申请日:2019-07-29
Applicant: 用友网络科技股份有限公司 , 北京大学
IPC: G06F16/36 , G06F16/903 , G06Q10/10 , G06Q10/06
Abstract: 本发明提出了一种基于ERP客户服务知识图谱的智能搜索方法及计算机设备,其中,基于ERP客户服务知识图谱的智能搜索方法包括:接收搜索字符串,解析搜索字符串的搜索信息;判断搜索信息是否在知识图谱的知识范围内;当判断结果为是的情况下,在知识图谱中匹配搜索信息所对应的知识条目;显示知识条目。本发明提出的基于ERP客户服务知识图谱的智能搜索方法,根据搜索字符串中的搜索信息,基于知识图谱计算和匹配对应的知识条目,再将搜索到的相关知识条目予以显示,从而实现智能搜索服务;可以准确、快速地将与搜索信息相关的知识作为搜索结果提供给用户,从而提高客户服务效率。
-
公开(公告)号:CN109918650A
公开(公告)日:2019-06-21
申请号:CN201910109002.7
申请日:2019-02-03
Applicant: 北京大学 , 广东智媒云图科技股份有限公司
Abstract: 本发明公布了一种自动生成采访稿的采访智能机器人装置及自动生成采访稿的智能采访方法,采访智能机器人装置包括采访模板、知识库、回答判别模块、关键词抽取模块、回答追问模块、语音合成模块、语音识别模块、文字输入模块、采访稿一键生成模块、情绪判别及调整模块、语速选择模块、检索模块;使用构建的采访模板结合检索的方式,根据用户回答问题的情况,按照不同逻辑支线进行采访,并且从用户回答中提取关键词信息,检索相应内容进行追问;通过提取关键词及采访模板匹配的方式,自动生成采访稿。本发明能够解决采访过程时聊天轮次少,聊天逻辑架构不清晰,语音识别不准确等问题。
-
公开(公告)号:CN107133212A
公开(公告)日:2017-09-05
申请号:CN201710311135.3
申请日:2017-05-05
Applicant: 北京大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于集成学习和词句综合信息的文本蕴涵识别方法,涉及语言文字处理领域。目前的中文文本蕴涵识别系统主要基于词汇特征、句法特征、知识库、人工定义的规则等,然而词汇、句法信息作为独立特征训练出的模型对数据的拟合度过低,规则、知识库覆盖范围有限。本发明提出加入综合词汇和句法信息的特征来训练分类器,并利用集成学习技术,有效提高文本蕴涵识别的准确性。其包括如下步骤:数据预处理;一致性转化;特征提取;集成学习训练;投票决策分类。本发明适用于各领域句子间蕴涵关系的识别。
-
公开(公告)号:CN107102976A
公开(公告)日:2017-08-29
申请号:CN201710177559.5
申请日:2017-03-23
Applicant: 北京大学
Abstract: 本发明公开了一种基于微博的娱乐新闻自动构建技术与系统,涉及语言文字处理领域。目前社交媒体在互联网上十分流行,有大量的娱乐新闻从微博中诞生。基于微博的娱乐新闻构建主要分为两个阶段。第一阶段为对微博是否具有新闻价值进行判别,筛选出内容有意义、公众关注度高或者引发热烈讨论的微博,主要通过对微博提取特征然后使用随机森林进行分类预测来完成;第二阶段新闻生成阶段,对前一阶段过滤后得到的微博使用模板为主的方式构建新闻。在收集大量的微博数据并标注后,本系统通过以上两个阶段即可完成自动的娱乐新闻构建,既能生成丰富的用户关注的新闻,又能有效节省人力物力。
-
公开(公告)号:CN102087648B
公开(公告)日:2013-06-19
申请号:CN200910242055.2
申请日:2009-12-03
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正电子政务信息科技有限公司 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种新闻评论页面的爬取方法及系统,属于信息检索和数据集成技术领域。该方法及系统首先从新闻网站起始页面出发,对页面进行广度遍历,在遍历过程中获取满足深度限制的页面信息;然后计算页面的特征值,根据特征值和预设阈值之间的大小关系,从页面中识别出新闻评论页面;最后获取新闻评论页面的翻页链接,并根据翻页链接获取其他新闻评论页面。本发明所述方法及系统,能够从新闻网站的网页中自动爬取出新闻评论页面,而且爬取的速度快,爬取的新闻评论页面全面。
-
公开(公告)号:CN101996190B
公开(公告)日:2012-08-08
申请号:CN200910090455.6
申请日:2009-08-12
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正电子政务信息科技有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种从网页中抽取信息的方法及装置,用以解决现有技术中不能从非结构化格式的网页中获取准确的信息问题。该方法包括:查找网页中的每种信息属性,获取每种信息属性对应的信息属性候选集,根据保存的信息属性间的位置关系与布局关系概率的对应关系,查找至少两种信息属性间的至少一个最大布局关系概率,并确定查找到的最大布局关系概率对应的位置关系,从所述至少两种信息属性对应的信息属性候选集中,抽取满足所述位置关系的信息属性组合。
-
公开(公告)号:CN102122296A
公开(公告)日:2011-07-13
申请号:CN201110048758.9
申请日:2008-12-05
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正电子政务信息科技有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种检索结果聚类方法及装置,用以解决按照现有技术提供的检索结果聚类方法使得用户难以按照聚类标签找到符合自己需求的检索结果的问题。其中,本发明公开的该方法包括步骤:从检索结果中选取规定数目的短语;针对选取到的每个短语,对检索结果中包含该短语的检索结果进行聚类,并将该短语作为该聚类的标签。
-
公开(公告)号:CN102117289A
公开(公告)日:2011-07-06
申请号:CN200910244539.0
申请日:2009-12-30
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正电子政务信息科技有限公司 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种从网页中抽取评论内容的方法和装置,涉及信息处理技术,通过建立评论页面的DOM树,并选择符合评论区抽取规则的子树抽取出评论区,再利用评论记录间的结构相似性,抽取出评论区中的评论记录,利用包含评论内容的子树的差异性,选择标准差最大的子树作为包含评论内容的子树,最后选取稳定性最小的一条路径中,稳定性差绝对值最大的相邻节点中的孩子节点作为根节点,这个子树就是要抽取的评论内容。由于利用了评论内容的无结构特性来进行抽取,而不是根据网页的模板进行抽取,所以网页的不同不影响抽取的准确性,并且不需要根据网页的模板进行复杂的配置,并通过计算去除了噪声信息,提高了从网页中抽取评论内容的效率和准确性。
-
公开(公告)号:CN101751431A
公开(公告)日:2010-06-23
申请号:CN200810239685.X
申请日:2008-12-15
Applicant: 北京大学 , 北大方正集团有限公司 , 北京方正电子政务信息科技有限公司
Inventor: 万小军
Abstract: 本发明公开了一种中文评论褒贬分析方法及装置,用以解决现有技术中采用基于语义计算的方法对中文评论进行分析时,分析结果的准确性不佳的问题。该方法将输入的中文评论翻译为对应的英文评论;并对翻译得到的英文评论执行拆分处理,以及将拆分处理结果与英文褒贬词汇库中的对应英文语义资源进行匹配,执行褒贬分析;输出分析结果作为对所述中文评论进行褒贬分析的褒贬倾向值。
-
-
-
-
-
-
-
-
-