一种确定相似语句的方法、装置及电子设备

    公开(公告)号:CN113869061A

    公开(公告)日:2021-12-31

    申请号:CN202111160667.4

    申请日:2021-09-30

    Inventor: 王斌斌 肖冰

    Abstract: 一种确定相似语句的方法、装置及电子设备,该方法包括:在接收到用户端输入的第一语句时,将所述第一语句放入包含意图识别文本的初始文本库中进行匹配,获得所述第一语句的N个相似语句,计算N个相似语句中每个相似语句与所述第一语句的相似度值,按照相似度值由大到小的规律对相似语句进行排序,并将排序后的相似语句返回至用户端。通过上述的方法,将意图识别文本中的语句作上标记并进行分类,将意图识别文本中的语句转化为向量,在语句匹配阶段,通过意图识别模型快速定位到语句的类别,从而避免了对全部语句进行检索造成匹配时间长的问题以及返回至用户端的相似语句不符合用户意图的问题,提高了返回至用户端的相似语句的准确度。

    一种文本分类方法及装置
    13.
    发明授权

    公开(公告)号:CN117708322B

    公开(公告)日:2025-02-18

    申请号:CN202311342239.2

    申请日:2023-10-17

    Abstract: 本申请公开了一种文本分类方法及装置,该方法包括第一设备可以根据预设的文本编码器对获取的目标文本信息进行编码,获得该目标文本信息对应的第一向量。第一设备可以根据第一向量从向量检索库中确定与第一向量的相似度最大的目标向量。其中,相似度的最大值大于预设的第一阈值。目标向量是根据多个与目标向量对应的文本类别相同的相似向量生成的。第一设备可以将目标向量对应的文本类别作为目标文本信息的文本类别。采用该方法,可以增加用于训练模型的数据,从而提高文本分类的准确性。同时,由于目标向量是根据多个相似向量生成的,将目标向量对应的文本类别作为目标文本信息对应的文本类别,可以进一步的提高文本分类的准确性。

    一种基于接口的多存储平台的统一管理系统和方法

    公开(公告)号:CN117235204A

    公开(公告)日:2023-12-15

    申请号:CN202311315104.7

    申请日:2023-10-11

    Abstract: 本发明公开了一种基于接口的多存储平台的统一管理系统和方法,包括:信息接收器、非结构数据管理中心;信息接收模块,用于通过RESTFUL接口接收非结构数据的存储请求,并将所述请求发送至非结构数据管理中心;非结构数据管理中心,用于解析所述存储请求,获取所述非结构数据的存储操作命令;将所述存储操作命令进行格式化处理,获取对应的目标云存储平台的可执行命令;将所述可执行命令分发至对应的目标云存储平台的SDK中。解决多存储平台非结构数据配置困难、工作繁重问题。

    智能客服的信息处理方法、装置、设备及介质

    公开(公告)号:CN114169335A

    公开(公告)日:2022-03-11

    申请号:CN202111501233.6

    申请日:2021-12-09

    Abstract: 本公开涉及一种智能客服的信息处理方法、装置、设备及介质。其中,包获取待分析文本和参考文本后,对待分析文本和参考文本进行分割处理,得到待分析文本和参考文本的分词信息,对分词信息进行实体识别,分别得到待分析文本和参考文本的实体信息,通过依存句法分析算法对实体信息进行分析,获得待分析文本和参考文本的依存关系信息;通过分词信息、实体信息和依存关系信息对相应的分词特征、实体特征和依存特征进行特征编码,得到特征向量集,基于特征向量集,通过二分类模型计算获得待分析文本和参考文本的相似度,能够从可以从专业词、句式、语义等多方面筛选高度相似的参考文本答案返回给待分析文本,有效去除噪音数据,大大提高匹配模型的精准度。

Patent Agency Ranking