基于深度学习的配电房设备开关部件状态监测方法和装置

    公开(公告)号:CN114301180B

    公开(公告)日:2024-08-06

    申请号:CN202111675600.4

    申请日:2021-12-31

    Abstract: 本申请涉及一种基于深度学习的配电房设备开关部件状态监测方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取待检测设备图像;待检测设备图像为对目标配电房中的电力设备进行拍摄得到的图像;电力设备包括至少一个开关部件;将待检测设备图像输入至台账标签识别模型,得到台账标签文本内容;以及将待检测设备图像输入至开关部件状态识别模型,得到开关部件的实际开关状态;台账标签文本内容用于表征电力设备的运行状态;确定开关部件在运行状态下的期望开关状态;若实际开关状态与期望开关状态不匹配,则生成针对电力设备的告警提示。采用本方法能够在配电房内对异常的电力设备及时生成告警提示,从而提升对电力设备的监测效果。

    一种端到端联结主义时间分类语音识别优化方法及系统

    公开(公告)号:CN117636848A

    公开(公告)日:2024-03-01

    申请号:CN202210965869.4

    申请日:2022-08-12

    Abstract: 本申请提供了一种端到端联结主义时间分类语音识别优化方法及系统。所述语音识别优化方法包括:基于预测文本和所述目标文本,计算联结主义时间分类损失函数;基于文本表征和转化后的语音表征,计算余弦损失函数;对联结主义时间分类损失函数和余弦损失函数进行加权相加,得到优化目标训练模型。本申请将联结主义时间分类损失函数和基于余弦的损失函数加权相加,得到优化目标训练模型。所述优化目标训练模型将预训练语言模型的非自回归结构和上下文关心的特点知识迁移至端到端联结主义时间分类器,可以缓解其条件独立性假设,从而提升识别性能。

    基于深度学习的电力场所人员身份识别方法和装置

    公开(公告)号:CN114495218A

    公开(公告)日:2022-05-13

    申请号:CN202210053485.5

    申请日:2022-01-18

    Abstract: 本申请涉及一种基于深度学习的电力场所人员身份识别方法、装置、计算机设备、存储介质和计算机程序产品,该方法包括:获取待检测人脸图像;待检测人脸图像为需要进入目标电力场所的人员的人脸图像;确定待检测人脸图像对应的人脸图像特征,并根据人脸图像特征确定待检测人脸图像对应的目标人员;获取目标人员的人员身份信息,以及,目标人员的电力工作票内容;确定执行电力工作票内容中的待执行任务所需的目标资质信息,若人员身份信息中的资质信息与目标资质信息匹配,则允许目标人员进入目标电力场所。采用本方法能够避免没有权限和资质的人员进入电力场所,造成安全事故,实现对进入电力场所的人员的精细化管理,提升电力场所的人员管控效果。

    声纹特征提取的方法和装置
    7.
    发明公开

    公开(公告)号:CN117672230A

    公开(公告)日:2024-03-08

    申请号:CN202210967353.3

    申请日:2022-08-12

    Abstract: 本发明提供了声纹特征提取的方法及装置,方法包括:确定语音片段对应的多帧语音特征;通过局部特征提取模块对多帧语音特征进行声纹信息提取确定第一局部特征;通过第一残差模块基于第一局部特征在不同时域感受野下提取声纹信息确定第二局部特征;通过第二残差模块基于第二局部特征在不同时域感受野下提取声纹信息确定第三局部特征;通过全局特征提取模块基于第三局部特征进行频域的信息的融合确定语音片段对应的全局特征;通过声纹特征提取模块提取全局特征的声纹信息,确定语音片段对应的声纹特征,声纹特征用于确定语音片段表示的说话人的身份信息。通过不同视野提取短语音片段的声纹特征,可以较为准确的识别短语音片段的说话人的身份。

    一种基于关键词的可控文本复述生成方法及装置

    公开(公告)号:CN117669551A

    公开(公告)日:2024-03-08

    申请号:CN202210967383.4

    申请日:2022-08-12

    Abstract: 本发明涉及一种基于关键词的可控文本复述生成方法及装置,所述方法包括:对待复述文本进行关键词提取,得到关键词列表,依次将关键词列表中的每一个关键词拆分为单字,将每一个单字作为一个token,得到token列表;将待复述文本输入到mT5模型中,进行迭代文本复述生成,得到待复述文本的复述文本集合,其中,任一轮迭代文本复述生成包括:将输入文本输入到mT5模型中,得到输出文本;对输出文本进行束搜索,得到第一结果文本;在token列表中选择第一个未被添加到输入文本中的token,将其添加到输入文本的尾部,得到第二结果文本;将第一结果文本与第二结果文本组合,得到生成结果集合;对生成结果集合进行束搜索,将搜索结果作为下一轮迭代的输入文本。

    一种语音通话中的背景人声过滤方法及装置

    公开(公告)号:CN117636888A

    公开(公告)日:2024-03-01

    申请号:CN202210967392.3

    申请日:2022-08-12

    Abstract: 本申请公开了一种语音通话中的背景人声过滤方法及装置,方法包括:获取目标语音;对目标语音进行活动语音切分,获得至少一个语音片段;对各个语音片段进行处理,确定各个语音片段为说话人有效语音或第一背景人声;若任意一个语音片段为说话人有效语音,则对任意一个语音片段进行分窗处理,获得任意一个语音片段的至少一个语音窗;确定各个第一短时平均能量,各个第一短时平均能量为每个语音片段的至少一个语音窗中各个语音窗的短时平均能量;根据各个第一短时平均能量和第一预设阈值,确定说话人有效语音包括第二背景人声;过滤掉第一背景人声和第二背景人声。本申请通过过滤掉第一背景人声和第二背景人声,使得说话人有效语音更加纯净。

    意图识别方法和装置
    10.
    发明公开

    公开(公告)号:CN117591269A

    公开(公告)日:2024-02-23

    申请号:CN202210967340.6

    申请日:2022-08-12

    Abstract: 本申请提供了一种意图识别方法和装置,包括:接收用户语音;将用户语音转化为语音文本;生成策略选择指令;响应于策略选择指令,确定当前计算资源的剩余资源量、多个预设的意图识别策略分别对应的计算时间;根据剩余资源量和多个预设的意图识别策略分别对应的计算时间,确定目标意图识别策略,其中,多个预设的意图识别策略包括目标意图识别策略;根据目标意图识别策略对语音文本进行识别,确定意图结果。根据本申请实施例,能够根据计算机的计算资源以及不同策略的计算时间,确定意图识别策略,从而在保证意图识别准确度的基础上,可以兼顾计算机的计算资源以及意图识别的速度,提高意图识别的效率。

Patent Agency Ranking