-
公开(公告)号:CN119003685A
公开(公告)日:2024-11-22
申请号:CN202410992223.4
申请日:2024-07-23
Applicant: 西安交通大学
IPC: G06F16/31 , G06F40/295 , G06N3/0455 , G10L15/26
Abstract: 本发明公开了一种法医口述记录的信息提炼与结构化处理方法及相关装置,属于法医口述信息处理技术领域;首先,将法医口述音频文件输入预先训练好的Transformer模型,得到文本转录信息;然后将文本转录信息通过大语言模型提取关键信息;最后将提取的关键信息按照数据结构进行组织和整合,构建法医口述记录的结构化数据库。本发明能够接收并转换口述记录信息为文本数据,利用先进的大语言模型进行深入的自然语言处理,包括精确的分词、词性标注和实体识别等步骤,从而从口述记录中提炼出关键信息。这些关键信息随后被组织并整合入结构化数据库中,以便于进行深入的数据分析、挖掘和应用,从而为法医鉴定、案件研究和司法调查提供了强有力的数据支持。