车机日志检测模型训练方法、装置、电子设备及存储介质

    公开(公告)号:CN117149479A

    公开(公告)日:2023-12-01

    申请号:CN202310916998.9

    申请日:2023-07-24

    Abstract: 本发明涉及一种车机日志检测模型训练方法、装置、电子设备及存储介质,包括:获取待检测的车机日志,生成车机日志对应车机日志数据,对车机日志数据进行精细化处理,得到精细化日志数据,基于精细化日志数据,确定目标日志模板中日志单词的词向量,并将日志单词的词向量的加权平均值作为目标日志模板向量,对车机日志数据进行滑动窗口分割,得到分割结果,采用目标日志模板向量对分割结果进行处理,得到待训练数据集,根据待训练数据集训练预设神经网络,得到车机日志检测模型。本发明实施例基于加权优化的最长公共子序列模型,对日志关键字段提高计算权重,提高了后续日志事件模板的精确率,从而提高了日志异常检测的准确率。

    空调设置方法、模型训练方法、装置、车辆及存储介质

    公开(公告)号:CN117002214A

    公开(公告)日:2023-11-07

    申请号:CN202310688313.X

    申请日:2023-06-09

    Inventor: 邓鹏 谭瑞

    Abstract: 本申请涉及智能汽车领域,特别涉及空调设置方法、模型训练方法、装置、车辆及存储介质。该方法应用于车辆的处理器;处理器包括训练好的推荐模型;推荐模型用于向用户推荐空调运行参数;方法包括:实时获取车辆传感器收集到的车辆的状态数据;状态数据包括车辆的运行状态和车辆外部的环境状态;获取目标用户的空调设置偏好的类别;根据车辆的状态数据、目标用户的空调设置偏好的类别和推荐模型,向目标用户推荐空调运行参数。由此,可以解决车载空调为用户推荐空调参数时,对车辆的网络要求较高的问题且无法为用户提供个性化的服务的问题。

    非均匀时序数据的处理方法、装置、电子设备及存储介质

    公开(公告)号:CN116307112A

    公开(公告)日:2023-06-23

    申请号:CN202310139040.3

    申请日:2023-02-20

    Inventor: 邓鹏 罗咏刚 谭瑞

    Abstract: 本申请涉及非均匀时序数据做预测技术领域,特别涉及一种非均匀时序数据的处理方法、装置、电子设备及存储介质,包括:获取当前车辆的非均匀时序数据;对非均匀时序数据进行预处理,并按照预设组合策略,对预处理后的非均匀时序数据进行数据组合,得到多个用于预测的数据组;将多个用于预测的数据组输入至预先构建的预测模型,并根据预测结果对当前车辆的未来状态进行预测。由此,解决了目前非均匀时序数据,不能直接作为时序模型的输入数据等问题,能够预测在一段时间内车内温度变化、车速变化、光照强度变化等,对驾驶员开启空调、空调温度设置造成怎样的影响,从而预估驾驶员开启空调的时间以及温度的设置,为驾驶员推荐所需要的空调设置。

    一种文本的聚类方法、装置、电子设备和可读存储介质

    公开(公告)号:CN116304049A

    公开(公告)日:2023-06-23

    申请号:CN202310282653.2

    申请日:2023-03-21

    Abstract: 本发明涉及一种文本的聚类方法、装置、电子设备和可读存储介质,其属于文本聚类的技术领域,该方法包括:对待聚类的多个目标文本进行分词,并确定各分词对应的词向量;确定任一目标文本所包含的多个分词之间的共线关系,并根据所确定的共线关系,生成任一目标文本的词图谱;确定词图谱对应的词图谱向量;将任一目标文本对应的词图谱向量,和任一目标文本所包含的多个分词的词向量拼接成一目标向量,并根据各目标文本对应的目标向量进行聚类。通过基于文本结构和文本内容来同时对文本进行聚类,提高了不同结构类的文本的聚类精度,从而提升了文本的聚类效果。

    语音文本实体纠错方法、装置、电子设备及存储介质

    公开(公告)号:CN116205214A

    公开(公告)日:2023-06-02

    申请号:CN202310165654.9

    申请日:2023-02-22

    Abstract: 本申请涉及一种语音文本实体纠错方法、装置、电子设备及存储介质,其中,方法包括:获取当前时刻抽取的当前实体当前意图、和当前环境状态,并进行拼音标注得到标注实体;基于当前意图,从预设的意图实体映射库中匹配对应的映射实体候选集,并计算标注实体与映射实体候选集中每个候选实体之间的拼音相似度;将大于第一预设阈值的候选实体按照预设排列规则生成实体召回集,并将多组向量集合输入至预设的评分模型,得到得分;若实体召回集中候选实体的最高分与各个实体对应拼接向量的最高分的差值大于或等于第二预设阈值,则将实体召回集中候选实体的最高分对应的实体替换当前实体,得到最终实体。由此,解决了通用领域候选词数量巨大纠错难度高的问题。

    用于对话场景的音似纠错方法及装置

    公开(公告)号:CN115545013A

    公开(公告)日:2022-12-30

    申请号:CN202211196704.1

    申请日:2022-09-29

    Abstract: 本申请公开了一种用于对话场景的音似纠错方法及装置,方法包括:基于预设语义协议,根据车机对话领域的多个实体构造规则数据;基于预先训练的泛化模型对规则数据进行泛化增强,生成泛化语料;采集车机对话领域的混淆词和近音字符,并按预设比例随机替换泛化语料,构造纠错数据,生成纠错语料;修改语言模型的mask规则,以音似字符代替随机字符进行mask,训练语言模型;基于预先构建的拼音规则表和纠错语料,增加近音噪音训练语言模型,得到偏音似的语言模型,以在对话场景中进行音似纠错。本申请实施例可以通过数据增强的方式训练偏音似文本分布的语言模型,在对话场景中音似纠错,提升了纠错检错的精确度,并且提升了车辆的交互感。

    基于结构化数据微调预训练语言大模型的方法及系统

    公开(公告)号:CN117271734A

    公开(公告)日:2023-12-22

    申请号:CN202311246615.8

    申请日:2023-09-25

    Abstract: 本发明提出一种基于结构化数据微调预训练语言大模型的方法及系统,涉及语音交互的技术领域,解决了工业领域中的结构化数据的微调需求,导致会话生成难度大的问题,首先设定预训练语言大模型的输入数据和输出数据,其次获取包含输入数据的特征的结构化数据,再对结构化数据进行预处理,得到文本数据,然后基于文本数据,生成包含输出数据的特征的训练语料,并利用训练语料对预训练语言大模型进行微调,得到用于会话生成的微调后预训练语言大模型。本发明满足了对工业领域中的结构化数据的微调需求,通过提高预训练语言大模型的泛化能力,有效降低了会话生成难度。

    联邦学习模型的训练方法、装置及汽车

    公开(公告)号:CN116484969A

    公开(公告)日:2023-07-25

    申请号:CN202310274322.4

    申请日:2023-03-20

    Inventor: 孟艺凝 谭瑞

    Abstract: 本发明提供一种联邦学习模型的训练方法、装置及汽车,涉及数据处理技术领域。该方法包括:路侧单元接收来自汽车的模型训练信息。路侧单元对数字签名进行校验,并在数字签名通过校验的情况下,确定第一时长和目标数据量是否满足预设安全条件。若第一时长和目标数据量满足预设安全条件,路侧单元则向区块链发送加密后的第一梯度信息。路侧单元从区块链获取加密后的全局梯度信息。路侧单元向汽车发送加密后的全局梯度信息,汽车用于基于加密后的全局梯度信息对待训练模型进行训练。如此,可以解决利用联邦学习技术训练模型获取的模型参数不准确的问题。

    一种数据增强方法、装置、设备及存储介质

    公开(公告)号:CN116383644A

    公开(公告)日:2023-07-04

    申请号:CN202310265899.9

    申请日:2023-03-17

    Inventor: 赵天棋 谭瑞 罗川

    Abstract: 本申请涉及一种数据增强方法、装置、设备及存储介质,涉及数据处理技术领域。该方法包括:对原始数据集进行数据预处理,得到处理后的数据集,数据预处理用于剔除原始数据集中包括的预设文本;将处理后的数据集中包括的多个第一文本分别输入至构建的目标模型中,生成每个第一文本对应的关联文本,得到包括多个第二文本的增强数据集,多个第二文本包括多个第一文本和每个第一文本对应的关联文本;对增强数据集中包括的多个第二文本进行数据清洗处理,得到清洗后的增强数据集,数据清洗处理用于基于预设阈值对多个第二文本进行筛选;将原始数据集和清洗后的增强数据集进行合并,得到数据增强后的训练数据集。

    模型构建方法、装置、设备、存储介质以及车辆

    公开(公告)号:CN116362255A

    公开(公告)日:2023-06-30

    申请号:CN202310285790.1

    申请日:2023-03-22

    Abstract: 本申请涉及一种模型构建方法、装置、设备、存储介质以及车辆,涉及人工智能技术领域。模型构建方法,方法包括:获取样本待识别文本、预设业务领域表、预设业务领域意图映射表、预设业务领域槽位映射表以及样本待识别文本对应的实际参数;将样本待识别文本、预设业务领域表、实际业务领域输入预设融合模型,以对预设融合模型进行训练,得到中间融合模型;将样本待识别文本、预设业务领域意图映射表、预设业务领域槽位映射表、实际意图、实际槽位输入中间融合模型,以对中间融合模型进行训练,得到训练好的融合模型;训练好的融合模型用于识别业务领域、意图以及槽位。用于减少部署阶段占用空间。

Patent Agency Ranking