基于释义基元词的中英跨语言词汇表征学习方法及系统

    公开(公告)号:CN109408814B

    公开(公告)日:2020-08-07

    申请号:CN201811158922.X

    申请日:2018-09-30

    Abstract: 本发明公开了一种基于释义基元词的中英跨语言词汇表征学习方法及系统,将中英两种语言的词汇以向量形式表示在同一个向量空间中,并结合语义信息获得更为精准的词嵌入。首先通过对汉语词典中的释义关系进行处理获得释义基元词集合,使得释义基元词集合中的词能够覆盖词典中的所有词汇语义。其次,将获得的释义基元词向量化表示,再将汉语词典和英文词典中的所有词汇用这些释义基元词进行表示。最后,结合中英文语料库的上下文语义关系,对词汇中的释义基元词表示设置一定的权重,获得更为精准的语义关系词嵌入。与现有词嵌入相比,本发明具有词嵌入精确度高、扩展能力强以及实现方便等优点,能更好的服务于后续的自然语言处理任务。

    一种基于神经网络的司法领域关系抽取方法及系统

    公开(公告)号:CN109933789A

    公开(公告)日:2019-06-25

    申请号:CN201910145396.1

    申请日:2019-02-27

    Abstract: 一种基于神经网络的司法领域关系抽取方法及系统,本发明在原有的开放式神经网络关系抽取框架基础上,构建司法领域专用数据集,并形成司法领域罪名特征集,通过优化神经网络提高关系抽取准确率的方法:首先,从中国裁判文书网获取大量司法领域相关非结构化文本,并用Word2Vec模型,Bert模型等向量转换模型得到文本的向量表示;其次,通过对非结构化文本进行TF-IDF词频统计,得到不同罪名及案由的特征集,并得到向量表示;然后优化OpenNRE模型及JointNRE模型,得到准确性更高的JudNRE模型;最后,利用JudNRE模型对文本向量,罪名特征向量向量进行处理,得到司法领域关系抽取模型,用于对待处理的司法领域非结构化文本数据进行司法领域关系抽取,得到对应的实体三元组。

    一种基于复杂网络的文本关键词获取方法及系统

    公开(公告)号:CN109885669A

    公开(公告)日:2019-06-14

    申请号:CN201910090349.1

    申请日:2019-01-30

    Abstract: 本发明提供了一种基于复杂网络的文本关键词获取方法及系统,其方法包括:首先,对待提取关键词的文本用NLP工具进行预处理;然后,采用文本成图的方法将预处理后的文本转化为网络结构表示;最后,采用复杂网络中的k-core分解方法对网络结构表示的文本的网络结构进行分解,得到网络结构表示的文本中的最核心词汇,也就是所需要的关键词,进而获取待提取关键词的文本的所有关键词。本发明的有益效果是:本发明所提出的技术方案从文本结构出发,利用文本的网络结构提高了获取文本关键词的准确性。

    一种基于RFID的公共场合人流量监控方法

    公开(公告)号:CN106228209A

    公开(公告)日:2016-12-14

    申请号:CN201610580389.0

    申请日:2016-07-21

    CPC classification number: G06K17/0029 G06K7/10415 G07C9/00

    Abstract: 本发明公开了一种基于RFID的公共场合人流量监控方法,该方法包括:建立基于RFID的公共场合人流量监控系统,并且依此测得大量的数据,进而建立判断当前人流量的基准值和极值;进行实时数据的获取:包括基于LSI提取人群覆盖面积的原始数据、获取人群移动速度及范围检测数据;将获得的数据与当前的标准相比较,判断当前人流的情况。本发明RFID技术的相关设备的性价比高,具有高耐环境的特性,可以大大减少投入成本;在公共场所中人群不用携带嵌有电子标签的卡片时,也可对当前的人流量进行实时的监控;LSI用来具体分析人群的覆盖面积,不仅可以验证当前的检测结果,也可为短时间内人流量的变化做出一定的预测。

    一种基于无线射频的卷钢仓库管理系统

    公开(公告)号:CN104992314A

    公开(公告)日:2015-10-21

    申请号:CN201510402333.1

    申请日:2015-07-10

    Abstract: 本发明公开了一种基于无线射频的卷钢仓库管理系统,包括位置RFID标签、Y轴RFID标签、第一读取器、X轴RFID标签、第二读取器、物品RFID标签及第三读取器;仓库空间通过分界线划分出仓库库位,分界线设有纵横坐标标示,位置RFID标签安装于所述纵横坐标标示上;Y轴RFID标签安装于所述吊机的行径轨道上,第一读取器安装在吊机的行走结构上;X轴RFID标签安装于所述吊机的横梁上,第二读取器安装在吊钩的移动机制上;物品RFID标签贴在平行于卷钢圆截面上,第三读取器安装于吊钩上。本发明能够在使用非特种RFID标签及读写器的情况下,最大可能的实现非规则仓库库位小型卷钢仓储中的物品识别。

    一种基于粒子群算法的多标签分类方法

    公开(公告)号:CN104991974A

    公开(公告)日:2015-10-21

    申请号:CN201510464344.2

    申请日:2015-07-31

    CPC classification number: G06F16/35

    Abstract: 本发明提供了一种基于粒子群算法的多标签分类方法包括优化阶段和分类阶段。优化阶段是采用粒子群算法优化特征加权KNN算法的特征权值;分类阶段是将优化阶段得出的特征权值应用到特征加权KNN算法中给测试样本X进行分类,最终输出测试集中所有样本的标签,即分类完成。本发明能够找到最优的特征权值来消除数据集中的特征(计算距离时是指属性值)的冗余或是不相关,从而减少了距离偏差,提高了分类的准确度。

    基于知识蒸馏的双知识图谱嵌入融合方法、介质、设备

    公开(公告)号:CN119721183A

    公开(公告)日:2025-03-28

    申请号:CN202411747332.6

    申请日:2024-12-02

    Abstract: 本发明公开基于知识蒸馏的双知识图谱嵌入融合方法、介质、设备,涉及知识图谱嵌入融合技术领域,方法包括:获取两个知识图谱及其嵌入向量、对齐的实体对集合P;两个知识图谱的嵌入向量由KGE模型训练得到;基于两个知识图谱的嵌入向量构建两个教师模型,两个教师模型以集合P建立连接,未训练的KGE模型为学生模型,并构建一个整合模型;基于知识蒸馏框架使用两个知识图谱训练学生模型,学生模型根据每次预测的三元组得分向两个教师模型询问,教师模型将对应得分传递给整合模型,整合模型生成软标签,并分配软标签权重,学生模型根据软标签对两个教师模型进行融合学习得到融合的图谱嵌入。本发明方法可提高知识图谱嵌入融合效率。

    一种基于攻击模式的网络攻击行为预测方法

    公开(公告)号:CN115333778B

    公开(公告)日:2024-05-14

    申请号:CN202210829333.X

    申请日:2022-07-15

    Abstract: 本发明公开了一种基于攻击模式的网络攻击行为预测方法,包括:构建网络攻击事理图谱;其中事理图谱由攻击行为组成;从事理图谱中抽取攻击模式;其中攻击模式由攻击行为之间的链路关系组成;聚合攻击模式及历史攻击行为,得到攻击模式和历史攻击行为的向量表示;采用改进GAT网络更新历史攻击行为表示,并利用更新的历史攻击行为,计算候选攻击行为得分,并对候选攻击行为进行排序;其中候选攻击行为,为所有待预测的攻击行为;候选攻击行为得分最高者为最终预测的攻击行为。本发明有益效果是:考虑了攻击主体的属性信息,并对主体的历史攻击行为进行编码,使其能够更好地服务于恶意行为预测任务。

    一种面向逻辑多态性的事理图谱表示学习方法及系统

    公开(公告)号:CN115269868A

    公开(公告)日:2022-11-01

    申请号:CN202210845839.X

    申请日:2022-07-19

    Abstract: 本发明提供了一种面向逻辑多态性的事理图谱表示学习方法及系统,所述事理图谱表示学习方法包括:对事理图谱中的节点进行向量化,以得到初步的向量表示;采用树状结构构建由事件组成的复合事件;考虑事件之间的逻辑关系,使用周期函数作为事件对置信度映射函数,对所述复合事件的事理逻辑进行建模;选择负采样策略对所述复合事件进行负采样;使用marginloss作为损失函数训练事件嵌入。本发明通过提出使用树状结构对事件组合进行建模,并采用周期函数作为事件得分的方式,既保证了模型对于复杂事件的表达能力,又保证了每个事件的嵌入质量,以适用于不同场景下的下游任务。

    一种基于语义元语的词向量表征学习方法及系统

    公开(公告)号:CN109325224B

    公开(公告)日:2022-03-11

    申请号:CN201810883567.6

    申请日:2018-08-06

    Abstract: 本发明涉及一种基于语义元语的词向量表征学习方法,包括以下三个步骤:输入预设英语词典,获得预设英语词典中所有词汇所对应的语义元语词汇;根据获得的语义元语词汇得到与其对应的基础词向量;在预设英语词典中选取目标词汇,根据目标词汇在原语句或段落中的释义及基础词向量获取目标词汇的目标词向量。获取目标词汇的目标词向量的具体步骤是:将每个词的各个释义代替这个词本身替换到原语句中,并保留语句意义与原语句最接近的一种释义,即得到了目标词汇的准确释义,用准确释义对应的语义元语词汇的词向量来适当地表达目标词,就能得到目标词汇的目标词向量。

Patent Agency Ranking