-
公开(公告)号:CN118411729A
公开(公告)日:2024-07-30
申请号:CN202410874316.7
申请日:2024-07-02
Applicant: 山东声通信息科技有限公司 , 上海声通信息科技股份有限公司
IPC: G06V30/148 , G06V30/19 , G06F40/109
Abstract: 本发明公开一种图片中文字抽取识别处理方法及系统,方法包括:将多张输入的完整字体图片与预设的多字体数据库进行比较匹配,获得目标字体数据库;将待检测的完整字体图片与目标字体数据库进行识别获得第一识别结果目标字;获取历史样本图像数据库,收集多张与第一识别结果目标字匹配对应的目标对象输入历史样本图像;对待检测的完整字体图片和多张目标对象输入历史样本图像进行像素点识别,得到目标对象输入历史样本图像的像素点信息和待检测的完整字体图片的像素点信息,计算相似度特征参数;确定多张目标对象输入历史样本图像中匹配度最高的目标对象输入历史样本图像,确定匹配度最高的目标对象输入历史样本图像中的目标最终文字。
-
公开(公告)号:CN118397520B
公开(公告)日:2024-09-03
申请号:CN202410851672.7
申请日:2024-06-28
Applicant: 山东声通信息科技有限公司 , 上海声通信息科技股份有限公司
Abstract: 本发明公开了一种工业巡检过程的目标物品识别处理方法,通过获取包含目标物体的视频信息;根据视频信息获取连续的多张视频帧图像信息,对每一帧进行独立的识别处理;根据各个视频帧图像信息中的SIFT特征信息进行分析识别,获取目标物体图像,通过SIFT特征信息,在每一帧图像中识别目标物体;根据目标物体图像进行标记,得到视频信息对应的各视频帧图像的目标物体,将识别结果反映到整个视频信息中,使得用户可以在每一帧中了解目标物体的位置和出现情况;从而实现对包含目标物体的视频信息进行准确识别标记,将识别结果反映到整个视频信息中,使得用户可以在每一帧中了解目标物体的位置和出现情况。
-
公开(公告)号:CN118535715A
公开(公告)日:2024-08-23
申请号:CN202411010080.9
申请日:2024-07-26
Applicant: 四川声通玄武信息科技有限公司 , 上海声通信息科技股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/31 , G06F16/36 , G06F40/279 , G06F40/30
Abstract: 本发明涉及知识库技术领域,提供一种基于树状结构知识库的自动回复方法、设备及存储介质。该方法包括:获取用户包括第一咨询内容、知识库类别、知识库类别下的知识库标签的第一咨询请求;根据知识库类别、以及知识库标签确定知识库中的当前节点。在当前节点下解析第一咨询内容,确定与第一咨询内容匹配的第一子节点,若第一子节点为第一引导节点,则在第一引导节点下确定与第一咨询内容匹配的知识点节点;若第一子节点为第一知识点节点,则确定第一知识点节点为与第一咨询内容匹配的知识点节点;根据与第一咨询内容匹配的知识点节点中的回复内容生成并输出第一咨询请求的反馈信息。本发明降低了对话系统的算力资源消耗,提升了对话系统的准确性。
-
公开(公告)号:CN118034300B
公开(公告)日:2024-08-16
申请号:CN202410242721.7
申请日:2024-03-04
Applicant: 上海声通信息科技股份有限公司
Abstract: 本发明涉及无人驾驶车辆控制领域,尤其涉及一种无人驾驶车辆的驾驶路线决策方法及系统,该方法通过车载传感器和通信设备收集车辆历史和实时的相关运行数据,并进行预处理;利用虚拟环境构建行为决策模型、局部决策模型和全局决策模型,并使用上述数据对模型进行训练;车辆根据输入的起始点和目标点,通过全局决策模型调用行为决策模型和局部决策模型生成车辆状态跳转的决策指令,控制车辆在局部运行过程中的动作执行。此外,该方法利用实时监测数据进行微调优化,并监测车辆运行状态和异常情况,做出对应的决策调整;通过该方法本发明能够提高无人驾驶车辆的决策效率和安全性,降低交通事故风险,同时具备极高的自适应性和鲁棒性。
-
公开(公告)号:CN117994112A
公开(公告)日:2024-05-07
申请号:CN202410193494.3
申请日:2024-02-21
Applicant: 上海声通信息科技股份有限公司
IPC: G06Q50/26 , G06Q10/0639 , G06F16/29
Abstract: 本发明公开了基于多领域数据整合分析的智慧城市监测管理方法及系统,属于数据分析技术领域,本发明获取城市的行政边界数据和城市面积数据;根据行政边界数据和城市面积数据,将城市等面积划分为多个区域;基于供电数据、供水数据、天然气供应数据,计算所有区域的供应指数;基于道路维修数据、噪音数据,计算所有区域的环境指数;基于交通数据、垃圾回收数据,计算所有区域的维护指数;基于供应指数、环境指数、维护指数,计算区域管理健康值,对所有区域的区域管理健康值进行升序排列,将区域管理健康值最小的对应区域进行预警。本发明对城市管理的各个领域进行精确的监测,对城市管理的水平进行评估。
-
公开(公告)号:CN118092353B
公开(公告)日:2024-10-22
申请号:CN202410228544.7
申请日:2024-02-29
Applicant: 上海声通信息科技股份有限公司
IPC: G05B19/418
Abstract: 本发明公开了一种基于在线视频的工业物联网巡检系统及方法,属于数据处理领域,本发明将采集得到的产品图像导入产品图像异常分析策略中进行产品图像异常分析,将采集得到的生产设备的生产数据导入生产数据异常分析策略中进行生产数据异常分析,将产品图像异常分析结果和生产数据异常分析结果导入异常辨别策略中进行异常辨别,获取异常辨别结果,根据异常辨别结果进行巡检结果的预警,对工业生产过程进行实时监控,对故障进行快速识别监控,有效地提高了对设备故障的识别准确率。
-
公开(公告)号:CN118609589A
公开(公告)日:2024-09-06
申请号:CN202410777609.3
申请日:2024-06-17
Applicant: 上海声通信息科技股份有限公司
Abstract: 本申请提供一种录音声道分割方法、设备及存储介质。包括:获取单声道录音的待分割录音,待分割录音中包括至少两个录音对象的录音段。从待分割录音中提取频谱特征,并将频谱特征输入训练好的录音分割模型中,通过录音分割模型输出至少两个录音对象的排列信息,以及,嵌入向量数组。根据嵌入向量数组,以及,各时间块内的各排列信息,获取非静音时间块,根据非静音时间块对应的嵌入向量数组,生成距离矩阵。根据距离矩阵,以及,与录音对象的数量相关的先验信息,通过层次聚类算法确定各时间块的标注信息。根据标注信息,生成待分割录音对应的RTTM文件。根据RTTM文件生成分割声道后的录音。本申请的方法,优化了电话录音的存储和处理方式。
-
公开(公告)号:CN118470013A
公开(公告)日:2024-08-09
申请号:CN202410925149.4
申请日:2024-07-11
Applicant: 山东声通信息科技有限公司 , 上海声通信息科技股份有限公司
Abstract: 本申请提供了一种工业视频图像中的目标物典型缺陷检测方法和系统;方法包括:获取待检测目标物图像,根据预定图像分割算法对待检测目标物图像进行预分割,得到多个图像子区域,提取每个超像素图像子区域对应的超像素区域的颜色特征和纹理特征,得到超像素区域的特征表示;根据遗传算法对特征表示进行转换,得到超像素区域的染色体表示,对染色体表示进行更新处理,得到满足适应度评价条件的子代种群的个体;对子代种群的个体进行染色体解码,得到目标解分割结果;合并所有图像子区域的目标解分割结果,得到待检测目标物图像的待检测最终分割图像;获取原始目标物缺陷图像的原始最终分割图像;通过两者匹配,判断待检测目标物图像是否存在缺陷。
-
公开(公告)号:CN118246666A
公开(公告)日:2024-06-25
申请号:CN202410320005.6
申请日:2024-03-20
Applicant: 上海声通信息科技股份有限公司
IPC: G06Q10/0631 , G06Q50/40 , G06F18/214 , G06N3/04 , G06N3/08
Abstract: 本发明涉及车辆管理技术领域,本发明公开了一种无人中巴车队调度系统及方法,包括基于调度记录数据、人流量数据、假日类型和预构建的等候时长预测模型确定充电等候时长,并获取目标车辆的实时SOC值,根据实时SOC值和充电等候时长判断是否前往充电区域,当目标车辆前往充电区域时,则需要获取快充桩的最低充电电压值以及目标车辆的实时电压值,基于实时电压值和最低充电电压值生成对比结果,并根据对比结果判断是否生成虚拟电压值或进一步确定充电策略,这样不仅能够避免目标车辆与快充桩之间出现无法连接的现象,又能进一步地对目标车辆的电池损耗进行优化。
-
公开(公告)号:CN118173287A
公开(公告)日:2024-06-11
申请号:CN202410244932.4
申请日:2024-03-05
Applicant: 上海声通信息科技股份有限公司
IPC: G16H80/00 , G16H50/20 , G16H40/67 , G06V10/75 , G06V10/764
Abstract: 本发明涉及在线医疗技术领域,本发明公开了一种医疗视频在线诊疗方法及系统,包括接收用户端上传的医疗语音请求,并根据预配置门诊识别模型获取患者的求诊科室类型;根据在线诊断数据获取求诊科室类型的最佳匹配医师,并将医疗语音请求转送至最佳匹配医师的医师端;当最佳匹配医师通过医师端接收医疗语音请求时,通过患者侧的用户端和医师侧的医师端建立远程视频通信;根据医疗语音请求中的症状部位关键词确定患者的表征部位,在远程视频通信过程中根据表征部位采集患者的多幅表征部位影像,将多幅表征部位影像输入预配置病症识别模型,获取患者的病因;本发明使用便捷,且能够辅助医师问诊,提高问诊医师的问诊效率和精准度。
-
-
-
-
-
-
-
-
-