-
公开(公告)号:CN119107946A
公开(公告)日:2024-12-10
申请号:CN202411176788.1
申请日:2024-08-26
Applicant: 哈尔滨工业大学
Abstract: 一种用于视觉障碍患者的环境感知交互系统,属于人工智能领域。唤醒模块,用于唤醒并接收用户语音,当检测到有唤醒关键词时,告知用户所述系统已被唤醒,并将系统切换为语音交互模式;语音交互模块,用于系统开启,当检测到用户语音时,将用户语音转换为用户需求机器文本并将其暂存;还用于接收人工智能模块输出的播报型机器文本,并转换、合成为人类语音;还用于将合成的人类语音向用户播报;视觉处理模块,用于获取当前场景的照片并进行目标检测,将照片及物品名称和位置信息输出至人工智能模块;人工智能模块,用于将接收到的文本、照片、物品名称和物品位置信息处理为基于盲人空间认知逻辑和认知地图范式的播报型机器文本输出至语音交互模块。