-
公开(公告)号:CN113377844A
公开(公告)日:2021-09-10
申请号:CN202110748160.4
申请日:2021-06-29
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/242 , G06F16/28 , G06F16/25 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种面向大型关系型数据库的对话式数据模糊检索方法及装置,面向大型关系型数据库的对话式数据模糊检索方法包括:获取查询指令;基于预先训练好的文本多标签分类模型,将所述查询指令分类到对应的目标数据库;基于预先训练好的命名实体识别模型,提取所述查询指令的实体,在所述目标数据库中检索出与所述实体相关的属性数据;基于预先训练好的语义识别模型,对所述查询指令进行语义识别,将语义识别结果与所述实体相关的属性数据对比,获得所述查询指令对应的数据检索结果。本发明可提高检索系统的智能性和检索效率。
-
公开(公告)号:CN105740310A
公开(公告)日:2016-07-06
申请号:CN201510963623.3
申请日:2015-12-21
Applicant: 哈尔滨工业大学 , 北京中科汇联科技股份有限公司
CPC classification number: G06F16/3344 , G06F16/951 , G06F17/2785 , G06F17/2795
Abstract: 本发明提供一种用于问答系统中的自动答案摘要方法及系统,其包括:获得用户查询问题与问答系统返回的候选答案集;从问题中提取概念,将概念与问题建立映射,得到问题概念集,从候选答案句子中提取概念,将概念与句子建立映射,得到句子概念集,对所有句子的概念集取并集得到答案概念集;对问题概念集进行概念扩展、概念约减,得到问题扩展概念集,问题扩展概念集与答案概念集取交集获得命中概念集;对命中概念集中包含的概念进行句子质量计算,得到答案摘要。本发明利用概念网络中各个概念的关系,构建句子等权重,克服句子可能与问题无关的问题,然后通过整数规划的方法,选出答案中和问题最为相关的句子,构成最终的答案摘要。
-
公开(公告)号:CN102043910B
公开(公告)日:2012-12-12
申请号:CN201010600321.7
申请日:2010-12-22
Applicant: 哈尔滨工业大学
Abstract: 一种基于Top-n-gram的蛋白质远程同源性检测和折叠识别方法,涉及一种蛋白质远程同源性检测和折叠识别方法。本发明为了解决现有的蛋白质远程同源性检测和折叠识别方法中,二进制谱无法找到最优阈值,无法区分氨基酸出现频率的差别的问题。具体步骤:一、运行PSI-BLAST,输入测试蛋白质序列进行多序列比对,计算氨基酸i的伪计数;二、生成频率谱;三、将频率谱转化为Top-n-gram;四、获得测试蛋白质序列对应的潜在语义表达向量;五、将测试蛋白质序列对应的潜在语义表达向量输入SVM分类器进行分类,得到预测结果。应用于蛋白质同源性检测和折叠识别领域。
-
公开(公告)号:CN101995963A
公开(公告)日:2011-03-30
申请号:CN201010551084.X
申请日:2010-11-19
Applicant: 哈尔滨工业大学
IPC: G06F3/023
Abstract: 词汇自适应中文输入方法,本发明涉及一种计算机、手机、或者掌上电子产品等的词汇自适应的中文输入方法。它降低输入法的背景噪音,减少系统开销,实现个性化输入。它用于汉字输入。它包括下述步骤:输入汉语拼音字符串;进行音节切分;根据本地的通用词库中词的状态和已经加载到本地的领域专业词库的状态对音节串进行汉语语句转换;输出汉字字符串;搜索位于服务器端的领域专业词库并判断已输入汉语语句中是否包含位于服务器端的领域词库集中的词汇;如果存在这样的词汇,则将包含该词汇的领域专业词库加载到本地;根据选择确定的汉语语句输入,对位于本地的通用词库和已经加载到本地的领域专业词库中的词进行词汇状态调整。
-
-
-