-
公开(公告)号:CN118503358A
公开(公告)日:2024-08-16
申请号:CN202410621289.2
申请日:2024-05-20
Applicant: 北京理工大学
IPC: G06F16/33 , G06F40/30 , G06F40/268 , G06F18/22 , G06N7/01 , G06Q50/18 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本发明公开的一种基于裁判文书结构和融合案件要素的类案匹配方法,属于自然语言处理领域。本发明利用裁判文书的固定结构进行分割,利用训练好的BERT‑BiLSTM‑CRF提取案件要素,形成融入案件要素的事实、事实‑推理、事实‑判决、依据四个部分。依据部分利用法条名称进行相似度计算。其余部分利用BERT模型进行编码,通过双向注意力机制形成原始文本、交互文本、文本差异度、文本相似度的融合高维语义。通过TextCNN‑BiLSTM‑Attention进行特征提取,计算余弦相似度之后和依据部分一起计算整体的相似度实现类案匹配的比较。本发明能够充分利用裁判文书结构且注重事实部分的重要性,且按照对应的部分对裁判文书进行匹配,显著提高类案匹配任务的精度。
-
公开(公告)号:CN118427306A
公开(公告)日:2024-08-02
申请号:CN202410621333.X
申请日:2024-05-20
Applicant: 北京理工大学
IPC: G06F16/33 , G06F40/289 , G06F40/30 , G06F40/216 , G06F18/214 , G06Q50/18 , G06N3/045 , G06N3/0442
Abstract: 本发明一种基于多层次匹配和预训练语言模型的法条推荐方法,属于自然语言处理领域。本发明使用BERT模型最后一层输出的向量经过BiLSTM提取上下文信息得到句级特征。利用法条对应的罪名特征和司法解释使用TF‑IDF技术对每一条法条提取关键词,利用交互注意力机制将法条关键词分别融入到事实和法条的文本向量中,采用最大池化保留最关键的特征得到关键词级别特征。利用BERT+CRF提取犯罪四要件,通过交互注意力机制将犯罪四要件分别融入到事实和法条的文本向量中,采用最大池化保留最关键特征得到犯罪四要件级别特征。综合句级、关键词级别、犯罪四要件特征多层次衡量事实与法条的相关性。本发明能实现法条多层次精准匹配推荐,辅助提高法条推荐任务的精度和效率。
-
公开(公告)号:CN118673928A
公开(公告)日:2024-09-20
申请号:CN202410639670.1
申请日:2024-05-22
Applicant: 北京理工大学
IPC: G06F40/30 , G06F40/284 , G06F16/35 , G06F18/231 , G06F18/24 , G06N3/0464 , G06N3/09
Abstract: 本发明公开的一种基于双曲图卷积网络和层次聚类的主题分类方法,属于自然语言处理中的文本主题分类技术领域。本发明实现方法为:对微博文本数据进行预处理,包括数据清洗、中文分词和去除停用词;使用TF‑IDF方法计算特征向量。将预处理后的文本数据映射到双曲空间,利用指数映射和对数映射在欧氏空间与双曲空间之间转换信息,同时保留双曲空间的层次结构特征。计算节点间的双曲距离并结合层次聚类算法,捕捉层次结构数据中的关系。相似或相关的节点能够在双曲图卷积网络的信息聚合过程中获得更高的权重,挖掘文本数据的层次结构,通过训练双曲图卷积神经网络捕捉微博文本数据的层次结构关系,利用训练好的双曲图卷积神经网络实现高质量的主题分类。
-
公开(公告)号:CN118607530A
公开(公告)日:2024-09-06
申请号:CN202410639788.4
申请日:2024-05-22
Applicant: 北京理工大学
Abstract: 本发明公开的一种基于Bert多层信息融合与双曲神经网络的情感分类方法,属于自然语言处理中的文本情感分析技术领域。本发明实现方法为:将预处理后的微博文本数据输入Bert嵌入层进行词嵌入,转变成向量的形式。将文本向量进入Bert多层信息特征提取层进行特征提取,进一步挖掘语义信息,通过注意力机制来将Bert中各个隐藏层中的CLS向量进行融合,将融合后的特征向量输入到双曲空间中挖掘深层层次信息,在双曲空间中完成特征聚合,实现高质量的情感分类。本发明特别适用于处理社会舆论网络等复杂网络的情感分类和公共舆论监控,解决传统方法在高维、非欧几里得结构数据空间中的分类难题,提高对网络数据中微博文本的表示和分类能力。
-
-
-