语音匿名化和装置
    31.
    发明公开

    公开(公告)号:CN119741919A

    公开(公告)日:2025-04-01

    申请号:CN202411802628.3

    申请日:2024-12-09

    Abstract: 本发明提供了一种语音匿名化方法,包括:将语音数据按照激活检测结果分割为语音数据片段,转写所述语音数据片段为文本序列;由敏感词列表和所述文本序列对比以获取敏感词,以敏感词替换符替换所述敏感词,生成脱敏文本片段;根据所述脱敏文本片段生成文本嵌入表征码,与随机声纹嵌入表征码拼接,生成拼接表征码;通过后向解码网络将所述拼接表征码解码为时频谱后,声码器将所述时频谱转化为音频波形。本发明有益效果:通过对语音声纹的修改和敏感词的提出,实现的在不改变语音数据属性的条件下,对语音数据脱敏和匿名化。

    一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919B

    公开(公告)日:2025-01-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

    一种针对隧道流量的关联方法和装置

    公开(公告)号:CN117768343A

    公开(公告)日:2024-03-26

    申请号:CN202311587718.0

    申请日:2023-11-24

    Abstract: 本发明提供一种针对隧道流量的关联方法和装置,其中所述方法包括:获取预建立的网络隧道的多个入口节点流和多个出口节点流;确定与每个出口节点流对应的候选入口节点流,分别计算多个候选入口节点流的累计传输量距离;将每个出口节点流输入至自编码网络,输出对应的映射入口节点流,分别计算映射入口节点流和多个候选入口节点流的降噪距离;将多个候选入口节点流输入至优化表示生成器,分别输出多个候选入口节点流之间的优化表示距离;根据多个候选入口节点流的累计传输量距离、和映射入口节点流的降噪距离以及多个候选入口节点流之间的优化表示距离,对候选入口节点流进行筛选,确定每个出口节点流对应的目标入口节点流。

    网络电话服务端的识别方法及装置、系统、电子设备

    公开(公告)号:CN115914056A

    公开(公告)日:2023-04-04

    申请号:CN202110914688.4

    申请日:2021-08-10

    Abstract: 本申请提供一种网络电话服务端的识别方法及装置、系统、电子设备,该方法包括:获取SIP流量,对SIP流量进行分析,获得目的IP信息;根据目的IP信息,对目标服务端的通信端口进行扫描,查找开放服务的目标端口;与开放服务的目标端口建立连接,并向开放服务的目标端口发送HTTP报文;根据HTTP报文的响应消息,确定目标服务端是否为网络电话服务端。由此可以高效地过滤出网络中大部分的VoIP运营平台信息,比传统的被动解析方式需要的资源更少且更加灵活,比传统的主动方式更加高效、目的性更强。在消耗少量资源的情况下,可以高效的进行定向分析,大大提高整体分析的高效性。

    一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919A

    公开(公告)日:2021-12-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

Patent Agency Ranking