融入字词粒度信息的句向量生成方法、装置、设备及介质

    公开(公告)号:CN116187300A

    公开(公告)日:2023-05-30

    申请号:CN202211097605.8

    申请日:2022-09-08

    Inventor: 杨稷

    Abstract: 本发明提供一种融入字词粒度信息的句向量生成方法、装置、设备及介质,方法包括:获取训练语句数据,对训练语句数据进行分词处理得到词数据;获取文本输入数据,解析文本输入数据得到字向量数据、词向量数据、位置向量数据、字符向量数据;对词向量数据进行线性层映射处理,转变词向量数据的向量数据维度,使词向量数据的向量数据维度与字向量数据的向量数据维度相同;根据词数据,将关联的词向量数据和字向量数据相加,记录词向量数据和词数据为扩展数据,记录字向量数据为第一单独数据;根据词数据,将不关联的字向量数据记录为第二单独数据。本发明可保证生成的句向量数据与文本输入数据相同。

    一种融入先验知识的短文本相似度计算方法

    公开(公告)号:CN114444490A

    公开(公告)日:2022-05-06

    申请号:CN202210114645.2

    申请日:2022-01-30

    Inventor: 杨稷

    Abstract: 本发明公开了一种融入先验知识的短文本相似度计算方法,包括如下步骤:S10、构建关键词字典;S20、对训练数据增加关键词标注;S30、对增加关键词标注的训练数据通过BERT模型训练,并保存最优结果;S40、对用户输入的query进行文本纠错;S50、对纠错后query和待匹配的question进行关键词提取,以及依存句法分析;S60、对步骤S50中的分析结果构建模型输入,并输入至训练好的BERT模型,以获得文本相似度。本发明对训练数据增加关键词和依存句法分析标注,给模型增加更多的先验知识,加快收敛速度。

    一种实体词提取方法及装置、电子设备、存储介质

    公开(公告)号:CN115759094A

    公开(公告)日:2023-03-07

    申请号:CN202211305534.6

    申请日:2022-10-24

    Inventor: 田尊明 陈浩 杨稷

    Abstract: 本发明提供一种实体词提取方法及装置、电子设备、存储介质,其中一种实体词提取方法包括:获取汽车领域的实体名词生成初始实体词表;基于所述扩充实体词表构建字典树模型;输入语料并进行分词,对所述扩充实体词表中词向量进行训练,得到词向量模型;输入问题字符,在所述字典树模型中搜索,保留命中的抽取词,通过所述词向量模型对所述抽取词进行编码,进行训练获得抽取模型;基于所述字典树模型、所述词向量模型和所述抽取模型的使用形成实体词提取方法。本方案中通过丰富汽车领域的实体词数据库,且全面的提取汽车领域的实体词补充到数据库,并进行词向量训练,使得智能对话中能够快速识别新输入的语料。

    文本情感识别方法及装置、电子设备、存储介质

    公开(公告)号:CN114911940B

    公开(公告)日:2025-03-28

    申请号:CN202210593767.4

    申请日:2022-05-27

    Inventor: 杨稷

    Abstract: 本发明提供一种文本情感识别方法及装置、电子设备、存储介质,本发明提供一种文本情感识别方法,包括:获取样本数据;对样本数据进行标注,并根据情感类别对标注后的样本数据进行分类处理,以得到样本数据集;通过对样本数据集进行语法层次排序和上下文编码,建立第一网络模型;根据第一网络模型的输出结果和分类处理结果,建立第二网络模型,并对第二网络模型进行训练,以得到文本情感识别模型,文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型;将待识别文本数据输入至文本情感识别模型,得到待识别文本数据的文本情感识别结果。能够获取更加丰富的文本特征信息,极大提升了对文本数据情感识别的准确性。

    人机对话方法、系统、装置、电子设备、存储介质

    公开(公告)号:CN116186217A

    公开(公告)日:2023-05-30

    申请号:CN202310009463.3

    申请日:2023-01-03

    Abstract: 本发明提供一种人机对话方法,包括接收用户初始对话信息;将所述对话信息输入预先构建的意图模型,获取对话意图;根据所述对话信息与所述对话意图,获取所述对话信息对应的槽位变量的值;根据所述槽位变量的值,进行回复;接收用户持续对话信息;根据所述持续对话信息,记录对话状态,仲裁决策当前的所述对话状态;根据所述持续对话信息进行实体动作预测,获得对应的保留或删除动作预测,基于预测结果,获取对话流中槽位变量的值,以在回复节点中进行回复。本申请可以精准的预测对话装置和实体动作,在槽位变更和意图变更时,不需要对模型的全量进行更新,可以灵活的应为用户自定义槽位和意图较多的场景。

    一种基于虚拟人的交互方法、装置、电子设备及存储介质

    公开(公告)号:CN117827052A

    公开(公告)日:2024-04-05

    申请号:CN202410005201.4

    申请日:2024-01-02

    Inventor: 杨稷

    Abstract: 本发明提供一种基于虚拟人的交互方法、装置、电子设备及存储介质,根据用户基本信息和第一次采集的多模态数据中至少之一判定用户身体健康状态,根据用户身体健康状态和第一次采集的多模态数据中至少之一确定交互方式,根据第一次采集的多模态数据匹配目标数据得到至少一初始用户意图及各初始用户意图的相似度,根据相似度排序得到交互顺序,根据各初始用户意图和交互顺序依次与用户以交互方式进行交互,获得第二次采集的多模态数据,直到得到确定后的初始用户意图,将确定后的初始用户意图确定为用户真实意图,根据交互方式和用户真实意图与用户进行交互;通过上述方法可以提供更实用、更准确的基于虚拟人的交互方法,增加用户的满意度。

    一种对话机器人的构建方法、装置、设备及存储介质

    公开(公告)号:CN116108200A

    公开(公告)日:2023-05-12

    申请号:CN202310058839.X

    申请日:2023-01-18

    Abstract: 本发明提供一种对话机器人的构建方法、装置、设备及存储介质,通过获取汽车行业的知识数据;从汽车行业的知识数据中提取出三元组数据,并基于三元组数据构建知识图谱,三元组数据包括目标实体数据、目标实体数据的关联数据、目标实体与关联数据的关系描述;根据目标实体数据、关联数据、关联描述中的任意两项构建用户询问模板;根据用户询问模板对知识图谱进行查询,获得查询结果,并基于查询结果构建回复语句;基于用户询问模板、回复语句构建对话机器人。本发明通过从汽车行业的知识数据中提取三元组数据,并通过三元组数据快速建立用户询问模板、回复语句。从而不需要手动录入,提高了对话机器人的建立效率。

    文本相似度的计算方法、装置、电子设备及存储介质

    公开(公告)号:CN115221284A

    公开(公告)日:2022-10-21

    申请号:CN202210864906.2

    申请日:2022-07-21

    Inventor: 杨稷 龙美元

    Abstract: 本申请涉及人工智能技术领域,特别涉及一种文本相似度的计算方法、装置、电子设备及存储介质,其中,方法包括:获取用户输入的第一文本和第二文本;将第一文本和第二文本输入训练完成的词性分析模型中,输出第一文本的第一词性信息和第二文本的第二词性信息,其中,词性分析模型基于携带有词性标签的第一训练样本训练得到;将第一词性信息和第二词性信息输入训练完成的相似度预测模型中,输出第一文本和第二文本之间的文本相似度结果,其中,相似度预测模型基于携带文本相似度标签的第二训练样本训练得到。由此,解决了相关技术中对于文本间的交互操作模糊,导致语义焦点丢失,降低文本相似度识别的准确性,用户体验较差等问题。

    文本情感识别方法及装置、电子设备、存储介质

    公开(公告)号:CN114911940A

    公开(公告)日:2022-08-16

    申请号:CN202210593767.4

    申请日:2022-05-27

    Inventor: 杨稷

    Abstract: 本发明提供一种文本情感识别方法及装置、电子设备、存储介质,本发明提供一种文本情感识别方法,包括:获取样本数据;对样本数据进行标注,并根据情感类别对标注后的样本数据进行分类处理,以得到样本数据集;通过对样本数据集进行语法层次排序和上下文编码,建立第一网络模型;根据第一网络模型的输出结果和分类处理结果,建立第二网络模型,并对第二网络模型进行训练,以得到文本情感识别模型,文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型;将待识别文本数据输入至文本情感识别模型,得到待识别文本数据的文本情感识别结果。能够获取更加丰富的文本特征信息,极大提升了对文本数据情感识别的准确性。

Patent Agency Ranking