训练文本转语音模型、文本转语音的方法、装置及设备

    公开(公告)号:CN119007706A

    公开(公告)日:2024-11-22

    申请号:CN202410801337.6

    申请日:2024-06-19

    Inventor: 王涛 王志铭

    Abstract: 本说明书实施例公开了一种训练文本转语音模型、文本转语音的方法、装置及设备。重新定义了文本转语音模型的输入数据的构成,输入数据不仅包括已插入韵律符号的文本对应的音素序列,也包括能够表示文本在至少一个粒度层级上的结构划分的结构标注信息,从而使得文本转语音模型在进行语音特征预测的过程中,不仅可以参考文本在音素层面的韵律,而且还可以参考文本在单字词、短语、语句等粒度层面上的韵律,这样可以使得预测出的语音特征所得到的语音韵律具有文本结构上发音的连贯性,韵律更加自然。需要说明,本公开属于人工智能领域的技术方案,在方案实现时,所使用的隐私数据已经得到所有方授权。

    一种针对数据库的访问控制方法及相关设备

    公开(公告)号:CN118445834A

    公开(公告)日:2024-08-06

    申请号:CN202410693504.X

    申请日:2024-01-10

    Abstract: 本说明书提供了一种针对数据库的访问控制方法及相关设备,针对所述数据库预先配置有至少一个限流规则,每个限流规则包含与预设的限流业务相关的查询语句模版以及对应的限流值。该方法包括:响应于针对所述数据库的目标访问请求,对目标访问请求中包含的与目标业务相关的目标查询语句进行模版化处理,得到与目标查询语句对应的目标查询语句模版;确定目标查询语句模版是否与至少一个限流规则中包含的查询语句模版匹配;若是,则根据至少一个限流规则中包含的与该查询语句模版对应的限流值,对目标访问请求进行限流处理。

    多音字发音的预测方法和装置
    3.
    发明公开

    公开(公告)号:CN116312490A

    公开(公告)日:2023-06-23

    申请号:CN202310162683.X

    申请日:2023-02-23

    Abstract: 本说明书实施例提供了多音字发音的预测方法和装置。该方法包括:得到需要向用户播放的交互内容;将该交互内容输入预先训练的韵律预测模型中,由该韵律预测模型输出带有韵律标签的交互内容;其中,韵律标签用于指示发音时的停顿;针对该交互内容中由各韵律标签分割出的每一个内容单元,检测该内容单元中是否包括多音字,如果包括,则根据该内容单元的上下文得到被包括的该多音字在该内容单元中的发音。本说明书实施例能够使得机器设备准确地确定出多音字的发音,并提高机器设备的处理效率。

    一种针对数据库的访问控制方法及相关设备

    公开(公告)号:CN117556452A

    公开(公告)日:2024-02-13

    申请号:CN202410039720.2

    申请日:2024-01-10

    Abstract: 本说明书提供了一种针对数据库的访问控制方法及相关设备,针对所述数据库预先配置有至少一个限流规则,每个限流规则包含与预设的限流业务相关的查询语句模版以及对应的限流值。该方法包括:响应于针对所述数据库的目标访问请求,对目标访问请求中包含的与目标业务相关的目标查询语句进行模版化处理,得到与目标查询语句对应的目标查询语句模版;确定目标查询语句模版是否与至少一个限流规则中包含的查询语句模版匹配;若是,则根据至少一个限流规则中包含的与该查询语句模版对应的限流值,对目标访问请求进行限流处理。

    语音合成方法、装置、设备及存储介质

    公开(公告)号:CN117475992A

    公开(公告)日:2024-01-30

    申请号:CN202311560939.9

    申请日:2023-11-21

    Inventor: 王涛 王志铭

    Abstract: 本申请实施例提供一种语音合成方法、装置、设备及存储介质,其中方法包括:将待合成语音的文本序列输入到音素预测模型中,得到所述文本序列对应的音素序列;将所述音素序列拆分为多维序列;其中,所述多维序列包括:字母序列和声调序列,所述字母序列由所述音素序列中的字母符号组成,所述声调序列由所述音素序列中的声调符号组成;将所述多维序列输入到声学模型中,预测所述音素序列对应的语音特征;其中,所述声学模型用于根据所述多维序列预测所述音素序列对应的语音特征,其基于音素序列样本拆分得到的多维序列预先训练得到;将所述音素序列对应的语音特征输入到声码器中,得到所述文本序列对应的语音。

    语音识别方法、系统及终端
    6.
    发明公开

    公开(公告)号:CN116189666A

    公开(公告)日:2023-05-30

    申请号:CN202310197712.6

    申请日:2023-02-27

    Inventor: 王涛

    Abstract: 本公开提供了一种多功能语音识别方法、系统和终端。本公开以拼音声韵母作为建模单元构建端对端语音识别系统,并增加建模单元概率输出模块,有效改善非近音字替换错误,并且相对于现有端到端语音识别系统,增加了端对端语音识别系统声学识别性能评估、以及发音标准度评估等多种功能。方法包括:接收待识别语音;对待识别语音进行声学特征提取并进行编码;使用汉字解码器对经编码的声学特征进行解码,其中所述汉字解码器以拼音声韵母为建模单元,将经编码的声学特征序列通过声韵母映射为汉字序列;以及输出语音识别结果。

    一种集合通信中的故障定位方法、装置、存储介质及设备

    公开(公告)号:CN119996173A

    公开(公告)日:2025-05-13

    申请号:CN202510125491.0

    申请日:2025-01-26

    Abstract: 本说明书公开了一种集合通信中的故障定位方法,集合通信中的每个通信成员均记录自己的通信日志,通信日志中包含集合通信对应的集合通信日志和集合通信中包含的各次点对点通信对应的点对点通信日志,当主机收到集合通信的告警事件时,则获取每个通信成员的通信日志,再根据告警事件中指示的故障类型,确定故障定位策略,采用确定出的故障定位策略对各通信成员的通信日志中的集合通信日志和点对点通信日志进行分析,从而在各通信成员中定位产生告警事件的根因。上述方法可有效快速的定位集合通信过程中产生故障的原因。

    一种针对数据库的访问控制方法及相关设备

    公开(公告)号:CN117556452B

    公开(公告)日:2024-06-18

    申请号:CN202410039720.2

    申请日:2024-01-10

    Abstract: 本说明书提供了一种针对数据库的访问控制方法及相关设备,针对所述数据库预先配置有至少一个限流规则,每个限流规则包含与预设的限流业务相关的查询语句模版以及对应的限流值。该方法包括:响应于针对所述数据库的目标访问请求,对目标访问请求中包含的与目标业务相关的目标查询语句进行模版化处理,得到与目标查询语句对应的目标查询语句模版;确定目标查询语句模版是否与至少一个限流规则中包含的查询语句模版匹配;若是,则根据至少一个限流规则中包含的与该查询语句模版对应的限流值,对目标访问请求进行限流处理。

    一种图数据的查询方法、装置以及设备

    公开(公告)号:CN114880504B

    公开(公告)日:2023-03-31

    申请号:CN202210796967.X

    申请日:2022-07-08

    Inventor: 王涛 刘冰叶

    Abstract: 本说明书实施例公开了一种图数据的查询方法、装置以及设备。方案包括:接收针对图数据的查询请求;在所述图数据中确定查找起始节点;从所述查找起始节点出发,沿着所述图数据中的边,在所述图数据中查找符合所述查询请求的目标节点;根据响应于所述查询请求所需返回的查询数据,判断是否需要对所述目标节点进行物化;若否,则在不对所述目标节点进行物化的情况下,返回相应的查询数据。

    属性识别方法和装置
    10.
    发明公开

    公开(公告)号:CN115062691A

    公开(公告)日:2022-09-16

    申请号:CN202210581712.1

    申请日:2022-05-26

    Abstract: 本说明书实施例描述了属性识别方法和装置。根据实施例的方法,首先获取来自至少两个模态的用于对属性进行识别的原始数据,然后分别针对每种模态的原始数据进行属性特征的挖掘。进一步,将得到的各个模态的属性特征进行融合后,即可根据融合后的融合特征得到属性的识别结果。本方案是通过将不同模态的数据进行融合来实现对属性的识别,如此能够充分吸取各个模态的数据对属性进行识别的优势,不会遗漏某些对属性识别有利的信息,从而能够提高属性识别的准确性。

Patent Agency Ranking