-
公开(公告)号:CN100446032C
公开(公告)日:2008-12-24
申请号:CN200610009761.9
申请日:2006-03-02
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6251
Abstract: 一种基于自组织映射网络的文档聚类方法,本发明涉及一种文档聚类方法。它克服了已有的自组织映射聚类方法难以做到对输入文档数据的自适应以及其固定结构所带来的神经元欠利用、网络映射欠准确以及边缘效应等问题。本发明方法的步骤:找出所有被选文档;将自组织映射网络的输出层初始化为环形结构,并把环形结构至少平分为两半,其中的每个扇形分别作为一个神经元;计算当前输出层的R2聚类准则系数;判断R2聚类准则系数是否大于阈值μ;结果为是,则终止自组织映射网络的训练,把被选文档按照当前自组织映射网络进行分类;结果为否,则在当前输出层中寻找具有最大类内离差平方和的神经元,在其附近插入新的神经元,并对当前输出层的所有神经元进行训练。
-
公开(公告)号:CN1808474A
公开(公告)日:2006-07-26
申请号:CN200610009761.9
申请日:2006-03-02
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6251
Abstract: 基于自组织映射网络的文档聚类方法,本发明涉及一种文档聚类方法。它克服了已有的自组织映射聚类方法难以做到对输入文档数据的自适应以及其固定结构所带来的神经元欠利用、网络映射欠准确以及边缘效应等问题。本发明方法的步骤:找出所有被选文档;将自组织映射网络的输出层初始化为环形结构,并把环形结构至少平分为两半,其中的每个扇形分别作为一个神经元;计算当前输出层的R2聚类准则系数;判断R2聚类准则系数是否大于阈值μ;结果为是,则终止自组织映射网络的训练,把被选文档按照当前自组织映射网络进行分类;结果为否,则在当前输出层中寻找具有最大类内离差平方和的神经元,在其附近插入新的神经元,并对当前输出层的所有神经元进行训练。
-
公开(公告)号:CN118246554A
公开(公告)日:2024-06-25
申请号:CN202410452960.5
申请日:2024-04-16
Applicant: 哈尔滨工业大学
IPC: G06N5/04 , G06F16/9035 , G06F16/903
Abstract: 本发明提供了一种面向多智能体辩论的检索增强推理方法、装置和设备,涉及人工智能技术领域,面向多智能体辩论的检索增强推理方法包括:当检测到输入数据时,基于所述输入数据进行检索,并构建证据池,所述证据池包括多个与所述输入数据相关的临时检索结果;将所述输入数据和对应的所述临时检索结果输入各所述智能体中,得到对应的临时推理结果;根据所有所述临时推理结果得到最终推理结果,其中,所述智能体基于大语言模型构建;本发明有助于在设计阶段减轻后续改进和调整的负担,从而提高了线路设计质量。
-
公开(公告)号:CN117708296A
公开(公告)日:2024-03-15
申请号:CN202311756728.2
申请日:2023-12-19
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/36 , G06N5/022 , G06F40/216
Abstract: 本发明提供了一种任务型对话系统和方法,涉及人工智能领域,该系统包括证据采集模块用于获取用户对话中的问询证据;结果预测模块用于对所述问询证据进行结果标签预测处理,得到标签预测概率,并比较所述标签预测概率与预设预测阈值;证据询问模块用于根据经验知识和领域知识图谱,对所述问询证据进行处理,得到所述问询证据的关键证据,对所述关键证据进行循证处理,得到循证结果,并将所述循证结果发送至所述结果预测模块进行结果标签预测处理。通过本发明通过借助经验知识和专业领域知识,实现提升任务型对话系统问询证据收集和处理的有效性,进而增加最终结果预测的准确性。
-
公开(公告)号:CN106933802B
公开(公告)日:2020-02-21
申请号:CN201710101834.5
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
IPC: G06F40/295 , G06Q40/08 , G06Q50/22
Abstract: 本发明提供了一种面向多数据源的社保类实体识别方法及装置,涉及实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的社保类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组社保类候选实体和第二组社保类候选实体;根据预先设置的判断策略选择第一组社保类候选实体或第二组社保类候选实体作为所述待处理语句中的社保类实体。
-
公开(公告)号:CN107122582B
公开(公告)日:2019-12-06
申请号:CN201710101829.4
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
Abstract: 本发明提供了一种面向多数据源的诊疗类实体识别方法及装置,涉及医疗实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定待处理语句中的每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的诊疗类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组诊疗类候选实体和第二组诊疗类候选实体;根据预先设置的判断策略从第一组诊疗类候选实体和第二组诊疗类候选实体中确定诊疗类实体结果。
-
公开(公告)号:CN106897559B
公开(公告)日:2019-09-17
申请号:CN201710103706.4
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
Abstract: 本发明提供了一种面向多数据源的症状体征类实体识别方法及装置,涉及医疗实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的症状体征类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组症状体征类候选实体和第二组症状体征类候选实体;根据预先设置的判断策略确定症状体征类实体结果。
-
公开(公告)号:CN107122582A
公开(公告)日:2017-09-01
申请号:CN201710101829.4
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
Abstract: 本发明提供了一种面向多数据源的诊疗类实体识别方法及装置,涉及医疗实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定待处理语句中的每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的诊疗类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组诊疗类候选实体和第二组诊疗类候选实体;根据预先设置的判断策略从第一组诊疗类候选实体和第二组诊疗类候选实体中确定诊疗类实体结果。
-
公开(公告)号:CN106933802A
公开(公告)日:2017-07-07
申请号:CN201710101834.5
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
Abstract: 本发明提供了一种面向多数据源的社保类实体识别方法及装置,涉及实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的社保类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组社保类候选实体和第二组社保类候选实体;根据预先设置的判断策略选择第一组社保类候选实体或第二组社保类候选实体作为所述待处理语句中的社保类实体。
-
公开(公告)号:CN106919794A
公开(公告)日:2017-07-04
申请号:CN201710101841.5
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
IPC: G06F19/00
Abstract: 本发明提供了一种面向多数据源的药品类实体识别方法及装置,涉及医疗实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定待处理语句中的每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的药品类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组药品类候选实体和第二组药品类候选实体;根据预先设置的判断策略从第一组药品类候选实体和第二组药品类候选实体中确定药品类实体结果。
-
-
-
-
-
-
-
-
-