-
公开(公告)号:CN112256932B
公开(公告)日:2021-04-09
申请号:CN202011522142.6
申请日:2020-12-22
Applicant: 中博信息技术研究院有限公司
IPC: G06F40/289 , G06F40/216 , G06Q30/00
Abstract: 本申请公开了一种地址字符串的分词方法及装置,根据基础地址库的数据,使用隐马尔可夫模型HMM对地址字符串进行状态预测;使用平滑优化算法提升状态预测的准确率;将概率最大的状态预测的结果转换为具体的地址信息。本申请以HMM模型作为基础,将长地址字符串视为一个观测序列,通过学习基础地址库中的状态转移规律,得出一个适用于中文地址分词标注的模型,并采用了平滑优化算法提升预测的准确率,计算结果可以得出该地址的状态序列,将概率最大的结果作为最终的地址分词方案,降低了人力时间成本,提升了效率。该方法不仅适用于电信领域的智能客服系统,还适用于其他具有地址分词相似场景的垂直领域。
-
公开(公告)号:CN116720215A
公开(公告)日:2023-09-08
申请号:CN202310656848.9
申请日:2023-06-05
Applicant: 中博信息技术研究院有限公司
Abstract: 本发明公开了一种实现数据脱敏的方法,属于大数据技术领域,包括采用SM4国密算法加密并通过数据类型转换的拦截方法对数据脱敏,解决了降低代码的耦合度、容易对脱敏策略进行修改或扩展并防止数据泄露的技术问题,具有高度的可定制化、高安全性、低耦合度和易于扩展和维护等优点,适用于需要保护数据安全和隐私的各种应用场景。
-
公开(公告)号:CN113362088A
公开(公告)日:2021-09-07
申请号:CN202110910888.2
申请日:2021-08-10
Applicant: 中博信息技术研究院有限公司
Abstract: 本发明公开了一种基于CRNN的电信行业智能客服图像识别的方法及其系统,属于图片识别技术领域,包括获取与电信领域相关的问题图片;在特征的提取模块中进行信息的抽取,得到问题图片的图像特征;在时序特征提取模块中利用RNN模型对图像特征进行双向LSTM的语序特征的表达,得到每一个图像特征的语序特征表达数据;CTC损失更新模块中得到识别模型,并利用不加CTC损失更新的CRNN前向网络得到图像预训练词向量模型,通过序列合并机制对齐不定长序列,解决了智能客服系统中没有图片处理的业务,不能很好满足用户的多方面的需求的技术问题,本发明提高了垂直领域的图像识别精度,满足客服系统多模态的需求。
-
公开(公告)号:CN112101010A
公开(公告)日:2020-12-18
申请号:CN202011316561.4
申请日:2020-11-23
Applicant: 中博信息技术研究院有限公司
IPC: G06F40/242 , G06F40/30 , G06F40/289 , G06F40/232 , G06N3/04 , G06Q10/10 , G06F40/117
Abstract: 本发明公开了一种基于BERT的电信行业OA办公自动化文稿审核的方法,属于大数据领域,建立客户端模块、敏感词识别模块、词语纠错模块和语义分析模块,解决了传统人工审核的效率低的问题的技术问题,本发明采用了BERT对特定领域的文稿进行了大规模的预训练,并基于此对文稿进行审核,提高了审核的准确性,同时将文字纠错、敏感词、语义等功能进行集成,能够很好的满足用户的各种需求。
-
公开(公告)号:CN115828219B
公开(公告)日:2024-08-16
申请号:CN202211598692.5
申请日:2022-12-12
Applicant: 中博信息技术研究院有限公司
Abstract: 本发明公开了一种智慧印章的管控方法及系统,涉及数据处理领域,其中,所述方法包括:基于印章的安全管理要求,设定印章管理参数;基于请求验证参数,生成使用监测指令;调用监测流程,通过图像采集设备对请求用户、盖章文档进行图像监测,获得使用监测图像集;基于监测特征,获得特征匹配结果;当特征匹配结果满足使用监测参数要求时,生成印章执行信息。解决了现有技术中针对印章的使用过程的管控准确性不足、全面性不高,进而造成印章的使用过程的管控效果不佳、印章的使用安全性低的技术问题。达到了提高对印章的使用过程进行管控的准确性、全面性,提高印章的使用过程的管控质量,提高印章的使用安全性的技术效果。
-
公开(公告)号:CN117057739A
公开(公告)日:2023-11-14
申请号:CN202311026088.X
申请日:2023-08-15
Applicant: 中博信息技术研究院有限公司
IPC: G06Q10/10 , G06N20/00 , G06F16/951 , G06F16/953 , G06F40/205
Abstract: 本发明涉及人工智能软件技术领域,尤其涉及一种基于大型语言模型的办公自动化问答方法及其系统,通过将大型语言模型,关键词抽取模型和办公系统结合,可以体现如何将语言模型应用到工作生产环境中解决上述问题;能够根据用户提出的问题进行对应的回答,根据用户的需求去系统中获取对应的数据,然后组织语言进行回答,并且可以根据用户的需求,更新系统数据。
-
公开(公告)号:CN111523328B
公开(公告)日:2023-09-05
申请号:CN202010284743.1
申请日:2020-04-13
Applicant: 中博信息技术研究院有限公司
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/242 , G06N3/02 , G06F16/332 , G06Q30/015
Abstract: 本发明公开了一种智能客服语义处理方法,属于人工智能自然语言里技术领域,建立客服客户端、样本数据采样模块和云服务器,在云服务器中建立DSSM语义相似度模型模块和TF‑IDF模型模块,基于样本数据训练DSSM语义相似度模型,基于海量数据训练TF‑IDF模型,构建TF‑IDF模型语义相似度计算方法,采用语义相似度的排序算法能够很好的平衡准确度与效率,采用人工客服的日常运维提供大量的对话知识库,以深度学习技术为算法核心的语义理解方法,为办公领域智能客服提供了快速准确的语义匹配,提高了办公效率。
-
公开(公告)号:CN115828219A
公开(公告)日:2023-03-21
申请号:CN202211598692.5
申请日:2022-12-12
Applicant: 中博信息技术研究院有限公司
Abstract: 本发明公开了一种智慧印章的管控方法及系统,涉及数据处理领域,其中,所述方法包括:基于印章的安全管理要求,设定印章管理参数;基于请求验证参数,生成使用监测指令;调用监测流程,通过图像采集设备对请求用户、盖章文档进行图像监测,获得使用监测图像集;基于监测特征,获得特征匹配结果;当特征匹配结果满足使用监测参数要求时,生成印章执行信息。解决了现有技术中针对印章的使用过程的管控准确性不足、全面性不高,进而造成印章的使用过程的管控效果不佳、印章的使用安全性低的技术问题。达到了提高对印章的使用过程进行管控的准确性、全面性,提高印章的使用过程的管控质量,提高印章的使用安全性的技术效果。
-
公开(公告)号:CN115048587A
公开(公告)日:2022-09-13
申请号:CN202210964817.5
申请日:2022-08-12
Applicant: 中博信息技术研究院有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/9538 , G06F16/951 , G06Q10/04 , G06Q10/06 , G06Q10/10 , G06K9/62 , G06N20/00
Abstract: 本发明公开了一种基于LambdaMart的通讯录搜索智能排序方法,属于大数据技术领域,包括利用基于LambdaMart的搜索智能排序计算方法,根据通讯录相关的组织、部门、姓名、往来邮件、和用户搜索行为日志等信息进行特征构造,并利用LambdaMart模型对上述特征进行训练,从而得到一个比较好的模型,并最终将该模型进行部署,解决了传统的搜索系统中基于规则的搜索排序的不准确和比较差的使用体验的技术问题,本发明与基于匹配形式的搜索相比具有更好的泛化能力,大大提高了用户的体验和搜索的速度,从而提高了办公的效率,并且该方法不仅适用于电信领域的通讯录搜索系统,还适应于其他需要智能搜索排序的其他领域。
-
公开(公告)号:CN112256932A
公开(公告)日:2021-01-22
申请号:CN202011522142.6
申请日:2020-12-22
Applicant: 中博信息技术研究院有限公司
IPC: G06F16/903 , G06Q30/00
Abstract: 本申请公开了一种地址字符串的分词方法及装置,根据基础地址库的数据,使用隐马尔可夫模型HMM对地址字符串进行状态预测;使用平滑优化算法提升状态预测的准确率;将概率最大的状态预测的结果转换为具体的地址信息。本申请以HMM模型作为基础,将长地址字符串视为一个观测序列,通过学习基础地址库中的状态转移规律,得出一个适用于中文地址分词标注的模型,并采用了平滑优化算法提升预测的准确率,计算结果可以得出该地址的状态序列,将概率最大的结果作为最终的地址分词方案,降低了人力时间成本,提升了效率。该方法不仅适用于电信领域的智能客服系统,还适用于其他具有地址分词相似场景的垂直领域。
-
-
-
-
-
-
-
-
-