一种加快医学关系抽取的方法和装置

    公开(公告)号:CN116401381A

    公开(公告)日:2023-07-07

    申请号:CN202310670289.7

    申请日:2023-06-07

    Abstract: 本发明公开了一种加快医学关系抽取的方法和装置,对于pipeline的关系抽取方法,在实体预测抽取前,通过排序以及合并规则机制对待预测文本进行长度和数量处理,调整待预测文本的长度并精简预测批次,经过bert模型时,减少多头自注意力机制层花费的时间,提升预测效率和关系抽取效率;在医学关系抽取前,对构建实体对时的实体进行判断,对于相同的实体类型不进行特征构建,对于不同的实体类型进行分析,从而去掉相同类型的实体对和不应该是头实体的实体对,对构建的实体对进行轻量化处理,提升预测效率和关系抽取效率。

    一种异步队列任务的报错处理方法及系统

    公开(公告)号:CN116501533B

    公开(公告)日:2023-08-25

    申请号:CN202310759103.5

    申请日:2023-06-26

    Abstract: 本发明提供了一种异步队列任务的报错处理方法及系统,该方法包括以下步骤:S1:将诊断文本进行分组预处理,并存入消息队列中;S2:从消息队列中逐组取出消息,并通过API接口压入第一数据库中;S3:异步任务开启,从第一数据库获取队列消息,解析后送入到抽取模型中执行关系抽取任务,若执行失败,则向第二数据库写入识别键值;S4:继续获取队列消息,并判断识别键值是否与当前消息的键对应,若对应,则当前消息跳过关系抽取任务;S5:重复S3‑S4步骤,直到消息处理完毕。本发明所提供的一种异步队列任务的报错处理方法及系统,通过获取异常任务的任务ID+时间戳作为唯一标识,从而判断后续任务是否可以直接跳过不处理,进而达到减少消息处理时间的目的。

    一种加快医学关系抽取的方法和装置

    公开(公告)号:CN116401381B

    公开(公告)日:2023-08-04

    申请号:CN202310670289.7

    申请日:2023-06-07

    Abstract: 本发明公开了一种加快医学关系抽取的方法和装置,对于pipeline的关系抽取方法,在实体预测抽取前,通过排序以及合并规则机制对待预测文本进行长度和数量处理,调整待预测文本的长度并精简预测批次,经过bert模型时,减少多头自注意力机制层花费的时间,提升预测效率和关系抽取效率;在医学关系抽取前,对构建实体对时的实体进行判断,对于相同的实体类型不进行特征构建,对于不同的实体类型进行分析,从而去掉相同类型的实体对和不应该是头实体的实体对,对构建的实体对进行轻量化处理,提升预测效率和关系抽取效率。

    一种异步队列任务的报错处理方法及系统

    公开(公告)号:CN116501533A

    公开(公告)日:2023-07-28

    申请号:CN202310759103.5

    申请日:2023-06-26

    Abstract: 本发明提供了一种异步队列任务的报错处理方法及系统,该方法包括以下步骤:S1:将诊断文本进行分组预处理,并存入消息队列中;S2:从消息队列中逐组取出消息,并通过API接口压入第一数据库中;S3:异步任务开启,从第一数据库获取队列消息,解析后送入到抽取模型中执行关系抽取任务,若执行失败,则向第二数据库写入识别键值;S4:继续获取队列消息,并判断识别键值是否与当前消息的键对应,若对应,则当前消息跳过关系抽取任务;S5:重复S3‑S4步骤,直到消息处理完毕。本发明所提供的一种异步队列任务的报错处理方法及系统,通过获取异常任务的任务ID+时间戳作为唯一标识,从而判断后续任务是否可以直接跳过不处理,进而达到减少消息处理时间的目的。

Patent Agency Ranking