一种基于编码和机器学习的多语种识别方法

    公开(公告)号:CN106528535B

    公开(公告)日:2019-04-26

    申请号:CN201611001398.6

    申请日:2016-11-14

    Abstract: 本发明提供了一种基于编码和机器学习的多语种识别方法,是计算机对自然语言的处理技术。本方法分别通过机器学习单元和编码识别单元对文本进行语种识别,编码识别时还统计各语种的单词量,当机器学习单元的识别结果在编码识别单元的判定区间内,且二者识别的语言一致时,输出单一识别语言,当编码识别单元识别到多种语言时,进行混合语言规则判断,若第二语言在文本中的单词量比例达到设定比例,则判定文本为混合语言。本发明对长文本可先作随机采样再判定,以提高识别效率。本发明能够准确、高效地实现中文简繁体、日、法、英等97种语言的语种识别,同时支持混合语种文本识别,在海量数据分析以及舆情监控中具有广泛的应用前景。

    基于即时通讯工具的社群关系分析方法及装置

    公开(公告)号:CN114117348A

    公开(公告)日:2022-03-01

    申请号:CN202111412510.6

    申请日:2021-11-25

    Abstract: 本发明公开了一种基于即时通讯工具的社群关系分析方法,包括:根据即时通讯工具获取用户发送的社群信息的基本数据,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,基于所述社群关系属性信息计算用户与发生社群关系的人员的关系值,将关系值高的人员定义为密切人员;根据所述基本数据采用中心度算法计算用户的中心值,将中心值高的用户定义为中心点用户,并将各中心点用户对应的密切人员及相应的关系值以可视化的方式展示。本发明还公开了一种基于即时通讯工具的社群关系分析装置。本发明能够多维度、全方面分析每个人在社交圈中的社交关系和该人员在社交圈中的重要程度。

Patent Agency Ranking