一种基于环境交互的机器人实时控制方法

    公开(公告)号:CN107292344B

    公开(公告)日:2020-09-18

    申请号:CN201710492773.X

    申请日:2017-06-26

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于环境交互的机器人实时控制方法,其特征在于:通过影像采集设备采集视频数据,获得机器人当前的状态信息,该状态信息通过以太网传输到后台服务器,所述后台服务器内安装有实时控制软件程序,由实时控制软件程序计算出机器人下一步该执行的动作,该动作控制信息再通过以太网传回给机器人,控制机器人执行动作;其中,所述实时控制软件程序是K‑means聚类算法和基于ε‑Greedy贪心策略的核方法的结合,计算出机器人基于环境交互的实时动作。本发明通过与未知环境的不断交互,去实现对机器人的实时控制,两种方式的结合,相互平衡,控制机器人能又好又快的完成指定任务。

    基于生成式对抗网络技术的医疗文本生成方法

    公开(公告)号:CN108491497B

    公开(公告)日:2020-06-02

    申请号:CN201810227535.0

    申请日:2018-03-20

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于生成式对抗网络技术的医疗文本生成方法,包括如下步骤:下载某个科属领域的多篇医疗文档;利用词向量来表示每篇医疗文档中的每个词;对每篇医疗文档进行文本分类,保留需要的医疗文档;获得每篇需要的医疗文档的最佳的输出序列标注;获得每篇需要的医疗文档的关键词集的索引,将索引随机打乱顺序,得到新的医疗文档及其对应的序列标注;采用基于生成式对抗网络的生成模型训练生成医疗文本;输出生成的医疗文本;获取生成的医疗文本的BLEU参数;对生成的医疗文本进行评估,最终得到目标医疗文本。本发明通过打乱数据生成新的医疗文本,解决病人的隐私安全问题和医疗文本较少的问题。

    一种通过自动创建抽象动作控制移动机器人的方法

    公开(公告)号:CN105867378B

    公开(公告)日:2018-07-31

    申请号:CN201610238110.0

    申请日:2016-04-18

    Applicant: 苏州大学

    Abstract: 本发明公开了种通过自动创建抽象动作控制移动机器人的方法,包括:1)初始化;2)按照Q学习模块的更新公式更新所有的状态‑动作评估值,并保存经验轨迹,去除经验轨迹中的重复状态区间内的状态;3)计算剩余状态的多样性密度值;4)若存在某个状态的多样性密度值达到预设阈值,则进入步骤5);否则重复步骤2)至4);5)选择多样性密度值大于阈值的状态作为子目标点,创建抽象动作模块,设置抽象动作的出发状态、策略和终止条件,将该抽象动作模块加入机器人的可选动作集中,采用更新后的可选动作集控制移动机器人。本发明能够有效地创建抽象动作,机器人可以利用创建的抽象动作进行分层强化学习,从而加速机器人在复杂环境下的学习。

    一种基于交通监控视频的实时在线交通状态检测方法

    公开(公告)号:CN104933868A

    公开(公告)日:2015-09-23

    申请号:CN201510338706.3

    申请日:2015-06-17

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于交通监控视频的实时在线交通状态检测方法,其特征在于:包括对应每个监控设备上设置一视频处理器,每一所述视频处理器经网络模块与远程服务器连接,其中:所述视频处理器读取对应所述监控设备上的视频图像,按照获得的图片求取每一帧图片中各像素点的灰度值X,并与预存参数值X-1比较,由核方法评估该视频处理器上观察到的路段拥堵程度ci,并上传;由远程服务器通过各个实时路段拥堵程度ci进行分析,获得从一个路口到下一个路口的路段拥堵程度值C。本发明通过视频处理器分析实时图像灰度,利用核方法评估拥堵程度并上传,减少了数据传数量,实现服务器对数据的实时获取,提高交通信息的处理能力和有效性。

    基于自动发现抽象动作的机器人分层强化学习初始化方法

    公开(公告)号:CN105955921B

    公开(公告)日:2019-03-26

    申请号:CN201610238118.7

    申请日:2016-04-18

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验,然后基于这些经验使用创建抽象动作模块让机器人创建抽象动作,最后机器人通过初始化状态‑抽象动作评估值Q(s,o)初始化模块,从普通的强化学习转向分层强化学习模块进行分层强化学习,并记录学习结果。本发明通过对状态‑抽象动作评估值Q(s,o)进行初始化,使机器人采用分层强化学习方法求解复杂环境中的任务时收敛速度更快。

    基于深度Q网络的废品回收机器人控制方法及其装置

    公开(公告)号:CN108415254A

    公开(公告)日:2018-08-17

    申请号:CN201810199112.2

    申请日:2018-03-12

    Applicant: 苏州大学

    CPC classification number: G05B13/042

    Abstract: 本发明公开了一种基于深度Q网络的废品回收机器人控制方法及其装置,其特征在于:所述传感系统:用于感知机器人面前物体位置信息,通过图像信息表示;所述控制系统:用于控制机器人抓取手臂抓取物体与放置物体于收纳机构内;所述作业系统:接收控制系统的信息,执行各项动作;所述驱动系统:用于为作业系统执行控制系统的各项动作提供动力;所述传感系统采集环境信息和驱动系统信息,并将环境信息和驱动系统信息传入控制系统,由控制系统根据接收到的信息来计算处理,并发送信息于作业、驱动系统驱动机器人执行相应动作。本发明运用人工智能领域的强化学习算法,能够自主学习更新神经网络的参数,以使机器人达到回收物品的控制效果。

    基于自动发现抽象动作的机器人分层强化学习初始化方法

    公开(公告)号:CN105955921A

    公开(公告)日:2016-09-21

    申请号:CN201610238118.7

    申请日:2016-04-18

    Applicant: 苏州大学

    CPC classification number: G06N99/005

    Abstract: 本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验,然后基于这些经验使用创建抽象动作模块让机器人创建抽象动作,最后机器人通过初始化状态‑抽象动作评估值Q(s,o)初始化模块,从普通的强化学习转向分层强化学习模块进行分层强化学习,并记录学习结果。本发明通过对状态‑抽象动作评估值Q(s,o)进行初始化,使机器人采用分层强化学习方法求解复杂环境中的任务时收敛速度更快。

    一种面向动态环境的机器人寻径在线控制方法

    公开(公告)号:CN105867427A

    公开(公告)日:2016-08-17

    申请号:CN201610238109.8

    申请日:2016-04-18

    Applicant: 苏州大学

    CPC classification number: G05D1/12

    Abstract: 本发明公开了一种面向动态环境的机器人寻径在线控制方法,包括:1)环境和参数初始化;2)由机器人的基本动作集合和抽象动作集合构成机器人的可选动作,初始化所有的状态?动作的评估值;所述抽象动作集合中的每个抽象动作为可中断的抽象动作;3)生成随机障碍物;4)通过动作选择模块及更新模块选择动作并对状态?动作的评估值更新;5)若到达终点状态,转向步骤6),否则进行步骤4);6)满足条件时结束本次任务,否则转向步骤3)。本发明通过引入中断机制,能够在线控制机器人使其能够将抽象动作应用到动态不确定的环境中,灵活应对动态环境,从而使得机器人能够解决复杂、动态环境下的任务,在提高效率的同时拓展应用环境。

    基于交通监控视频的路况实时获取装置及方法

    公开(公告)号:CN104933867A

    公开(公告)日:2015-09-23

    申请号:CN201510338643.1

    申请日:2015-06-17

    Applicant: 苏州大学

    CPC classification number: G08G1/0104 H04N7/181

    Abstract: 本发明公开了一种基于交通监控视频的路况实时获取装置及方法,其特征在于:包括视频处理器、网络模块、远程服务器、数据推送器以及数据接收器,其中:所述视频处理器读取对应所述监控设备上的视频图像,按照获得的图片求取每一帧图片中各像素点的灰度值X,并与预存参数值X-1比较,由核方法评估路段拥堵程度ci,并上传;由远程服务器实时分析,获得路段拥堵程度值C,数据推送器将拥堵路段的信息发送至数据接收器上,由数据接收器输出。本发明通过视频处理器分析实时图像灰度,利用核方法评估拥堵程度并上传,由数据推送器实时发送信息,接收器实时播报,实现驾驶员路况信息的实时获取,及时规划行车路线,减少拥堵。

Patent Agency Ranking