一种可用于小样本场景的命名实体识别方法

    公开(公告)号:CN118114674A

    公开(公告)日:2024-05-31

    申请号:CN202410412924.6

    申请日:2024-04-08

    Applicant: 东北大学

    Abstract: 本发明公开一种可用于小样本场景的命名实体识别方法,涉及自然语言处理中的命名实体识别技术领域。本发明中包括一种新的编码二维坐标表的方法,在二维坐标表中对每个坐标对应的Span段同时对其是否为某一实体的任一边界和是否为某一实体的左右边界进行标注,每个训练样例可以产生更多有效的训练对,可以有效缓解训练样例信息利用不充分问题,此编码还可以通过解码输出的标注结果方式处理命名实体嵌套及不连续问题,此外,使用了一种单双边界交叉注意力模块,有助于模型识别效果,为了缓解小样本样例不足、训练困难的问题,本发明进一步利用不同任务中对应的不同命名实体类型作为提示词,增加训练的信息,降低任务的难度。

    基于推理轨迹生成的带权有向推理树集合的搜索推荐方法

    公开(公告)号:CN118673131A

    公开(公告)日:2024-09-20

    申请号:CN202410823151.0

    申请日:2024-06-25

    Applicant: 东北大学

    Abstract: 本发明提供基于推理轨迹生成的带权有向推理树集合的搜索推荐方法,涉及搜索推荐技术领域。该方法包括:根据用户需求收集特定业务场景下的历史文本数据并提取语义信息,利用提取到的语义信息构建具有语义信息且包含完整推理轨迹的带权有向推理树集合;采用向量空间映射和推理路径融合的方法将该带权有向推理树集合中的带权有向推理树转换为向量表示;将大模型作为策略模型,采用基于大模型的推理轨迹生成方法生成完整的推理路径,并构建偏好数据集,采用直接偏好优化算法对策略模型进行优化;获取用户提供的检索词并输入优化后的策略模型中,得到该检索词的最终推荐结果,从而为用户提供更加个性化和优质的搜索结果和推荐内容。

Patent Agency Ranking