一种基于多模态数据的社交关系分析方法、系统和存储介质

    公开(公告)号:CN115293920A

    公开(公告)日:2022-11-04

    申请号:CN202210971424.7

    申请日:2022-08-12

    Abstract: 本发明提出一种基于多模态数据的社交关系分析方法,包括:S1,提取人员的社交文本和社交图像信息,分别转换为文本特征和图像特征,并统计人员亲密度,基于人员亲密度构建人员社交网络图;S2,将文本特征和图像特征输入基于transformer的多模态融合模型,获得融合特征;S3,采用Si‑SCAN图聚类算法对人员社交网络图进行分析,获得社交关系聚类结果,其中,Si‑SCAN图聚类算法通过在SCAN算法基础上引入人员亲密度和融合特征信息构建。本发明基于文本、图像两个模态的信息对社交关系进行深入分析,通过多模态信息融合模型的设计,学习跨模态间的交互关系,生成多模态融合的图节点嵌入表征。通过图聚类分析,实现对社交网络的深层关系分析,能够有效发现潜在的社交关联。

    一种基于文本标签预测的聊天话题识别方法及系统

    公开(公告)号:CN117194980A

    公开(公告)日:2023-12-08

    申请号:CN202311117065.X

    申请日:2023-08-31

    Abstract: 本发明提出了一种基于文本标签预测的聊天话题识别方法及系统,该方法包括如下步骤:响应于获取所需处理的聊天数据信息并进行预处理;利用已训练的深度学习模型对预处理后的所述聊天数据信息进行处理,包括句子编码和序列标注;通过所述深度学习模型从所述聊天数据信息中识别出所需的特定内容并进行进一步处理。通过引入Sentence Bert对聊天发言进行语义特征提取,以句子作为语义单元输入到模型中,极大扩充了特征标注网络的长度限制;利用特征标注的方法,分别标注网络诈骗中常出现的行为,即使话术有更新,但真正关键的诱导行为不会有较大变化;通过改造卷积神经网络模型,使得模型能够进行序列标注任务,并保留了卷积神经网络较高的推理性能。

    一种中文词向量压缩方法、系统和存储介质

    公开(公告)号:CN114970456A

    公开(公告)日:2022-08-30

    申请号:CN202210582102.3

    申请日:2022-05-26

    Abstract: 本发明提出一种端到端的大规模中文词向量压缩方法,包括:S1,根据原始的词向量的词性分布,构建词性到编码长度的映射表;S2,对原始的词向量特征进行压缩生成压缩编码,通过所述压缩编码和编码书重构词向量,获得重构的词向量特征,其中编码书为压缩编码矩阵。上述方案利用中文词性保留了语义信息,属于同一词性的压缩编码共用同一本码书,实现相同词性间的语义信息共享,保持模型语义分析性能的同时进一步缩减了大规模词表的压缩编码,提高模型的压缩率,实现了对大规模中文词向量模型的有效压缩。本发明还提出了对应的中文词向量压缩系统和存储介质。

    一种基于多层次语义编码的特定目标情感分析方法及装置

    公开(公告)号:CN115221321A

    公开(公告)日:2022-10-21

    申请号:CN202210851412.0

    申请日:2022-07-19

    Abstract: 本申请提出了一种基于多层次语义编码的特定目标情感分析方法,该方法包括以下步骤:S1、获取待分析文本,对待分析文本进行分词;S2、使用句法解析工具对分词的结果进行解析,生成依存句法树,并根据依存句法树构建句法遮盖矩阵;S3、将待分析文本的分词结果转换为词向量二维矩阵,使用transformer模型对词向量二维矩阵进行编码,获取待分析文本的浅层语义特征;S4、将句法遮盖矩阵和浅层语义特征输入至句法注意力网络,获取深层语义特征;以及S5、根据深层语义特征计算特定目标的文本表示向量,最终获得特定目标的情感分类。该方法可应用于特定目标情感分类任务,而且句法注意力组件的可扩展性也为自然语言处理领域的其他任务提供了新的思路。

    一种中文词向量压缩方法、系统和存储介质

    公开(公告)号:CN114970456B

    公开(公告)日:2024-09-24

    申请号:CN202210582102.3

    申请日:2022-05-26

    Abstract: 本发明提出一种端到端的大规模中文词向量压缩方法,包括:S1,根据原始的词向量的词性分布,构建词性到编码长度的映射表;S2,对原始的词向量特征进行压缩生成压缩编码,通过所述压缩编码和编码书重构词向量,获得重构的词向量特征,其中编码书为压缩编码矩阵。上述方案利用中文词性保留了语义信息,属于同一词性的压缩编码共用同一本码书,实现相同词性间的语义信息共享,保持模型语义分析性能的同时进一步缩减了大规模词表的压缩编码,提高模型的压缩率,实现了对大规模中文词向量模型的有效压缩。本发明还提出了对应的中文词向量压缩系统和存储介质。

Patent Agency Ranking