-
公开(公告)号:CN109670164B
公开(公告)日:2024-09-20
申请号:CN201810319393.0
申请日:2018-04-11
Applicant: 东莞迪赛软件技术有限公司 , 电子科技大学广东电子信息工程研究院
IPC: G06F40/289 , G06F16/35 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种基于深层多词嵌入Bi‑LSTM残差网络的健康舆情分析方法,涉及信息技术领域,该基于深层多词嵌入Bi‑LSTM残差网络的健康舆情分析方法通过改进Bi‑LSTM网络,结合多词嵌入以及残差网络方法,提高了网络的鲁棒性,使之能够对复杂舆情文本进行处理,得到了很好的效果,从而提高其分类器的分类精度。
-
公开(公告)号:CN111027324A
公开(公告)日:2020-04-17
申请号:CN201911235614.7
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F40/295 , G06F40/30 , G06N20/00
Abstract: 本发明属于关系抽取的技术领域,具体涉及一种基于句法模式和机器学习的开放式关系的抽取方法,包括如下步骤,步骤一、对输入文本进行预处理,然后从所述输入文本中抽取实体和关系指示词,并组合为关系三元组格式,获取实体关系三元组候选集;步骤二、基于正负例判别算法,采用词向量模型和同义词林,通过计算句法模式之间的语义相似度,对关系候选集中每个三元组进行正负例判断,给出相应标签,自动生成所需的训练语料;步骤三、融入浅层和深层的文本特征,训练一个SVM分类器,对实体关系三元组进行区分和辨别。本发明能够对关系元组进行正负例判别,降低错误的句法分析对抽取关系元组带来的影响,有助于提高关系抽取的准确性。
-
公开(公告)号:CN111026878A
公开(公告)日:2020-04-17
申请号:CN201911236864.2
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
Abstract: 本发明属于信息抽取的技术领域,具体涉及一种基于Bi-LSTM网络的无监督属性的抽取方法,包括:步骤一,生成向量集,使向量集中的每个向量的长度相等,将向量集中的每个向量输入Bi-LSTM网络;步骤二,Bi-LSTM网络对每个向量提取所需的信息,然后通过设置筛选词的方式对所需的信息进行过滤;步骤三,过滤后的信息经softmax函数输出,获得并标注所需要抽取的实体关系。本发明的Bi-LSTM网络主动地对输入的每个向量进行训练和标注,从而实现无监督地捕获和抽取所需的信息,有利于实现特征的自主学习和实体关系的高效抽取。
-
公开(公告)号:CN111026877A
公开(公告)日:2020-04-17
申请号:CN201911236858.7
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
Abstract: 本发明属于信息抽取技术领域,具体涉及基于概率软逻辑的知识验证模型构建与分析方法,包括以下步骤:a、将信息抽取系统从多个数据源的网页web文本中抽取的知识组成候选知识集;b、对候选知识集进行可信度计算;c、将候选知识集中的每一个实体进行逻辑谓词表示;d、分别基于实体解析和本体约束构建知识验证模型的一阶逻辑规则,通过已构建的逻辑规则生成概率软逻辑模型中的一阶逻辑规则,实现候选知识集中实体关系、实体标签验证;e、设置知识验证模型的概率分布并通过推理算法计算选取相应的只是作为待更新的知识。本发明通过对候选知识集验证,使得候选知识集准确度得到了大幅的提高。
-
公开(公告)号:CN111026854A
公开(公告)日:2020-04-17
申请号:CN201911236857.2
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F16/332 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明属于自动应答的技术领域,具体涉及一种答案质量的评估方法,包括如下步骤,步骤一、采用BLSTM模型,对问答对的文本特征进行评估;步骤二、抽取若干个非文本特征,对所述问答对的非文本特征进行评估;步骤三、综合所述文本特征的评估和所述非文本特征的评估,然后将候选答案的综合得分从高到低进行排序,最后从所述候选答案中选择出最佳答案。本发明通过结合问答对的文本和非文本的特征以评估答案质量,有助于提高问题和答案的匹配度,从而提高答案的质量。
-
公开(公告)号:CN110991186A
公开(公告)日:2020-04-10
申请号:CN201911235517.8
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F40/295 , G06K9/62 , G06F17/18 , G06N5/04
Abstract: 本发明属于实体解析技术领域,具体涉及一种基于概率软逻辑模型的实体解析方法,包括以下步骤:a、将实体解析中的实体属性、实体关系以及本体约束分别进行逻辑谓词表示;b、分别基于实体属性、实体关系以及本体约束构建实体解析过程中的一阶逻辑规则;c、结合步骤a中声明的逻辑谓词与步骤b中构建的逻辑规则设置一个关于实体解析的概率软逻辑模型;d、对概率软逻辑模型进行权重学习;e、使用推理算法对概率软逻辑模型进行计算,通过实体解析概率值。与现有技术相比,本发明通过进行谓词逻辑表示,提出基于实体属性相似度、实体关系、本体约束的逻辑规则构建,实现了概率软逻辑模型的实体解析过程,有效地提高了实体解析的准确率与执行效率。
-
公开(公告)号:CN111026815B
公开(公告)日:2024-02-06
申请号:CN201911235530.3
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
Abstract: 本发明属于信息抽取技术领域,具体涉及基于用户辅助修正下的实体对特定关系抽取方法,包括以下步骤:a、设置人工标注模块,该模块用于按需导入数据,并进行人工标注;b、构建基于深度学习的模型训练模块,其包含多个深度学习模型,训练数据经过不同的深度学习模型找出最优模型并替换抽取模型;c、对人工标注数据及校正数据进行整合以及对特定的过滤清理,并依据分词结果进行数据的预处理;d、构建关系校正模块供用户进行辅助修正,由用户判断抽取是否正确。本发明在保证用户能动性的前提下,让用户对相应数据进行标注,纠正计算机的错误,教会计算机如何产出想要的结果,通过伴随用户的辅助修正不断提高了特定关系抽取的准确率。
-
公开(公告)号:CN107632998B
公开(公告)日:2021-04-23
申请号:CN201710605947.9
申请日:2017-07-24
Applicant: 电子科技大学 , 电子科技大学广东电子信息工程研究院
IPC: G06F16/904 , G06T11/20 , G06T11/60
Abstract: 本发明公开了一种基于人体形态的多维数据可视化方法;本发明首先运用数据挖掘中的K‑means聚类方法将数据集中的各个数据记录进行聚类,并建立各簇集的颜色映射表;其次,进行人体形态可视化布局的设计;然后,建立数据属性与人体各部位特征以及平行坐标轴之间的映射关系;最后,根据各簇集的颜色映射表为各人体面颊加上对应颜色。通过使用本发明的方法进行多维数据的可视化,可更加方便和有效地对数据进行分析,把握各个数据记录的特点,并得出准确结论,为进一步的数据分析建立了良好的基础。
-
公开(公告)号:CN111027323A
公开(公告)日:2020-04-17
申请号:CN201911235554.9
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F40/295 , G06F40/30 , G06F40/211 , G06F16/35 , G06K9/62
Abstract: 本发明公开了一种基于主题模型和语义分析的实体指称项识别方法,包括如下步骤,步骤一、对输入语料进行句子分割、分词、词性标注和依存关系解析;步骤二、基于句法分析,获取边界完整的名词词组作为实体指称项的候选集,然后综合利用LDA主题模型和TF-IDF统计算法,从候选集中过滤非实体指称项;步骤三、度量实体指称项和种子实体的语义相似度,选择相似度高的种子类别作为实体类别,然后利用浅层的句法知识设置规则,将每种实体类别的实体指称项分类到相应的指称项类别。本发明能够提高实体边界检测和分类方法的有效性。
-
公开(公告)号:CN111026815A
公开(公告)日:2020-04-17
申请号:CN201911235530.3
申请日:2019-12-05
Applicant: 电子科技大学广东电子信息工程研究院
Abstract: 本发明属于信息抽取技术领域,具体涉及基于用户辅助修正下的实体对特定关系抽取方法,包括以下步骤:a、设置人工标注模块,该模块用于按需导入数据,并进行人工标注;b、构建基于深度学习的模型训练模块,其包含多个深度学习模型,训练数据经过不同的深度学习模型找出最优模型并替换抽取模型;c、对人工标注数据及校正数据进行整合以及对特定的过滤清理,并依据分词结果进行数据的预处理;d、构建关系校正模块供用户进行辅助修正,由用户判断抽取是否正确。本发明在保证用户能动性的前提下,让用户对相应数据进行标注,纠正计算机的错误,教会计算机如何产出想要的结果,通过伴随用户的辅助修正不断提高了特定关系抽取的准确率。
-
-
-
-
-
-
-
-
-