融合词汇和句法信息的中文命名实体识别方法及系统

    公开(公告)号:CN114818717A

    公开(公告)日:2022-07-29

    申请号:CN202210575509.3

    申请日:2022-05-25

    Applicant: 华侨大学

    Abstract: 本发明公开一种融合词汇和句法信息的中文命名实体识别方法及系统,包括以下步骤:步骤1、将原始输入文本映射为字向量,使用改进后的词集匹配算法引入外部词汇信息,并整合在每个字的输入表示中;步骤2、根据字的输入表示,利用双向LSTM抽取上下文信息;步骤3、使用NLP工具从原始输入文本中获取词性标签和句法成分,并且使用健值记忆网络构造句法向量,再通过门控机制对上下文向量与句法向量进行加权融合,获得特征向量;步骤4、将特征向量输入标签预测层的CRF中,实现中文命名实体识别。本发明能够解决中文命名实体中实体边界信息不足的问题和融合输入文本的句法信息。

    一种基于模糊综合评判的网络舆论引导效果预测方法

    公开(公告)号:CN111428113B

    公开(公告)日:2022-07-01

    申请号:CN202010229129.5

    申请日:2020-03-27

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于模糊综合评判的网络舆论引导效果预测方法,通过网络爬虫技术爬取事件相关信息,根据网络舆论态势指数,构建网络舆论威胁评估指标体系;对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集;对威胁等级模糊集解模糊化,得到网络舆情威胁指数,进行舆情评估;实现了对网络舆论引导方法的效果预测,为有效的舆论引导提供辅助决策信息,对事件的进行实时监测和预警,也可用于事件引导仿真的效果度量。

    一种侨情问答方法、装置、设备及存储装置

    公开(公告)号:CN112905744A

    公开(公告)日:2021-06-04

    申请号:CN202110211603.6

    申请日:2021-02-25

    Applicant: 华侨大学

    Abstract: 本发明实施例提供一种侨情智能问答方法、装置、设备及存储装置,涉及自然语言处理技术领域。其中,这种侨情问答方法包含如下步骤:S1、构建四层结构的侨情概念树。S2、爬取互联网上的侨情非结构化文本数据。其中,侨情非结构化文本数据包含有侨情信息。S3、根据侨情概念树和侨情非结构化文本数据,生成侨情知识图谱。其中,侨情知识图谱根据Neo4j图数据库建立。S4、接收侨情查询语句。S5、根据侨情查询语句从侨情知识图谱中搜索答案。S6、输出答案。通过构建侨情概念树将侨情中的各种数据进行汇总、分类、集合,形成侨情知识图谱,合理的将侨情信息整理起来。基于侨情知识图谱实现了知识问答,使得侨情信息的查询变得更为简单。

    一种融合知识图谱表示学习和偏置矩阵分解的推荐方法

    公开(公告)号:CN111125540A

    公开(公告)日:2020-05-08

    申请号:CN201911100389.6

    申请日:2019-11-12

    Applicant: 华侨大学

    Abstract: 本发明提出一种融合知识图谱表示学习和偏置矩阵分解的推荐方法,结合了知识表示学习、基于偏置矩阵分解和梯度下降的优化方法。首先,通过现有知识库构建项目推荐的知识图谱;其次,利用知识图谱表示学习将项目实体嵌入低维的向量空间,接着,利用相似度函数计算低维向量空间中项目之间的相似性,最后,将相似性潜在因子融入偏置矩阵分解模型中,以此融入项目间的隐含信息。本发明提高评分预测的准确性从而有效的提高推荐的成功率和精准度。

    一种集成浅层语义表示向量的深度学习文本分类方法

    公开(公告)号:CN110069632A

    公开(公告)日:2019-07-30

    申请号:CN201910284980.5

    申请日:2019-04-10

    Applicant: 华侨大学

    Abstract: 本发明公开了一种集成浅层语义表示向量的深度学习文本分类方法,方法包括:首先对文本语料训练词嵌入向量,其次利用领域词汇字典作为浅层语义词汇,基于浅层语义词汇,生成文本语料中每一个词的浅层语义向量表达。接下来将两个词向量进行加权拼接作为新的词向量输入到CNN模型中,进行特征提取和模型训练,构建文本分类器。本发明解决基于大数据驱动的词向量表达缺少词法特征和知识表示,难以真正理解词汇语义信息的缺陷,使得模型具有更加丰富的特征表达和更高的分类性能。

    一种基于视觉词典优化和查询扩展的图像检索方法

    公开(公告)号:CN106156374A

    公开(公告)日:2016-11-23

    申请号:CN201610820534.8

    申请日:2016-09-13

    Applicant: 华侨大学

    CPC classification number: G06F16/583 G06K9/6218

    Abstract: 本发明公开了一种基于视觉词典优化和查询扩展的图像检索方法,包括:提取训练图像的SIFT特征,并利用基于密度的聚类方法对SIFT特征进行聚类,生成视觉词典组;通过卡方模型分析视觉单词与目标类别的相关性大小,同时结合视觉单词词频滤除一定数量的视觉停用词;将SIFT特征与优化后的视觉词典进行映射匹配,得到视觉词汇直方图;将查询图像的视觉词汇直方图与训练图像的视觉词汇直方图进行相似性匹配,根据初次匹配结果并结合查询扩展策略进行二次或多次检索,得到最终检索结果。本发明提供一种提高图像检索准确率为目的的基于视觉词典优化和查询扩展的图像检索方法。

    基于模糊综合评判技术的社交网络用户认知脆弱性分析方法及装置

    公开(公告)号:CN118536610A

    公开(公告)日:2024-08-23

    申请号:CN202410643263.8

    申请日:2024-05-23

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于模糊综合评判技术的社交网络用户认知脆弱性分析方法及装置,包括:构建认知脆弱性三级评估指标体系,获取用户在社交网络上发表的文本内容,根据文本内容分别分析用户在人格维度、兴趣维度和情感维度所对应的三级指标的分值;采用层次分析法分别确定二级指标和三级指标对应的权重系数;对三级指标进行认知脆弱性等级模糊化,确定三级指标对应的隶属函数,根据三级指标对应的隶属函数和权重系数以及二级指标对应的权重系数利用模糊综合评判计算用户的认知脆弱性等级的隶属函数,根据三级指标的分值和用户的认知脆弱性等级的隶属函数计算得到用户认知脆弱性指数,从而实现用户认知脆弱性分析。

    一种基于多模态融合的图像主题分类方法和系统

    公开(公告)号:CN118212475A

    公开(公告)日:2024-06-18

    申请号:CN202410468662.5

    申请日:2024-04-18

    Applicant: 华侨大学

    Abstract: 一种基于多模态融合的图像主题分类方法和系统,包括:通过数据预处理构建图像对应的叙事文本和概念文本;将图像及其对应的叙事文本和概念文本输入预训练的特征提取模型得到图像特征、图像概念文本特征和图像叙事文本特征;采用标签注意力融合机制将所述图像特征和概念文本特征进行融合得到第一融合特征,利用多模态交叉注意力融合机制将所述图像特征和所述叙事文本特征进行融合得到第二融合特征;对所述第一融合特征和所述第二融合特征进行拼接融合和标签预测,实现图像主题分类。本发明融合文本信息辅助图像的新闻主题分类,提升模型的可解释性和泛化性。

    一种基于相似性增强传播结构图的谣言检测方法

    公开(公告)号:CN117725433A

    公开(公告)日:2024-03-19

    申请号:CN202311793721.8

    申请日:2023-12-25

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于相似性增强传播结构图的谣言检测方法,包括以下步骤:基于公开数据集提取新闻内容特征和用户特征;基于公开数据集构建传播结构图及邻接矩阵;利用用户特征的相似性增强传播结构图;利用图卷积网络获得统一传播结构图特征;对齐统一传播结构图特征和新闻内容特征;增强新闻内容特征和传播结构图特征;基于增强传播结构图特征获得增强统一传播结构图特征,将增强新闻内容特征、增强统一传播结构图特征以及对齐的统一传播结构图特征和新闻内容特征送入分类器,判断新闻是否属于谣言。本发明深入研究社交网络中用户偏好相似性的影响,同时考虑社交网络中的传播结构图以及用户之间的潜在关系,更全面地揭示了谣言传播的特征。

Patent Agency Ranking