一种基于表格语义注释的数据库检索方法、装置以及设备

    公开(公告)号:CN117033469B

    公开(公告)日:2024-01-16

    申请号:CN202311285986.7

    申请日:2023-10-07

    Abstract: 在本说明书公开了一种基于表格语义注释的数据库检索方法、装置以及设备,根据训练完成的表格语义注释模型对数据库中各原始表格进行语义注释,得到第二语义注释表格,即确定原始表格中各实体单元格的语义以及该表格中各列的列类型。然后响应于用户的检索指令,对用户的检索指令进行文本预处理,并计算经过文本预处理后的检索指令与第二语义注释表格计算相似度,按照相似度从大到小的顺序筛选语义注释后的表格,将筛选出的第二语义注释表格对应的原始表格作为检索结果。使得数据库检索可根据表格的语义信息进行相似度匹配,提高了数据库检索的召回率和准确率。

    用于大语言模型的富文本数据处理方法、设备、存储介质

    公开(公告)号:CN117252153A

    公开(公告)日:2023-12-19

    申请号:CN202311532530.6

    申请日:2023-11-17

    Abstract: 本发明涉及一种用于大语言模型的富文本数据处理方法、设备、存储介质,方法包括如下步骤:获取富文本数据,通过解析和/或识别得到文本数据及其对应的坐标;基于字体大小对所述文本数据对应的坐标进行单位化处理;以空格为元素构建字符矩阵,基于单位化处理后的坐标,将所述文本数据填充至所述字符矩阵的对应位置;将所述字符矩阵转换为包含空间信息的最终文本,作为大语言模型的输入。与现有技术相比,本发明整个处理过程类似于将整个富文本进行栅格化处理,可以对多种文档类型进行处理的同时,保留了原始富文本中的空间信息。

    一种基于大语言模型的智能对话方法、装置、介质及设备

    公开(公告)号:CN117076650A

    公开(公告)日:2023-11-17

    申请号:CN202311328288.0

    申请日:2023-10-13

    Abstract: 在本说明书提供的基于大语言模型的智能对话方法,根据用户输入的第一文本的分类结果,确定不同的对话方法,当用户输入的第一文本为非知识类文本时,将第一文本输入第三方大语言模型确定返回用户的目标文本。当用户输入的第一文本为知识类文本时,对第一文本进行本地搜索和线上搜索,再将第一文本和所有的搜索结果输入本地大语言模型,确定返回用户的目标文本,若不存在关联度大于预设值的检索结果,则将第一文本输入第三方大语言模型,将第三方大语言模型的输出结果作为返回用户的目标文本。通过在系统中融合若干个本地模型,减少了对第三方大语言模型的调用,降低了智能对话系统的使用成本的同时,也降低了智能对话过程的时延。

    一种面向矛盾纠纷调解的异常检测系统及方法

    公开(公告)号:CN116860977A

    公开(公告)日:2023-10-10

    申请号:CN202311053620.7

    申请日:2023-08-21

    Abstract: 本发明公开了一种面向矛盾纠纷调解的异常检测系统及方法,包括:数据获取模块,获取原始表格数据;数据清洗模块,清洗数据获取有效数据;时序异常检测模块,从有效数据构建时序数据,对时序数据进行线性插值,并对其进行异常检测,得到异常时间段;主题聚类模块:从事项文本获取有效词向量,输入至文本聚类模型,提取事项的主题聚类结果;异常分析模块:对比异常时段与正常时段中事项主题分布的差异,进一步提取聚类主题,提取各聚类主题的关键词和摘要。本发明能够有效感知和汇聚近期异常的矛盾纠纷事件,为管理者提供异常报告,能够以数据驱动的方式提前感知问题,介入纠纷,避免纠纷的扩大和矛盾的深化,提高社会治理的智能化水平。

Patent Agency Ranking