一种标签语义增强的弱监督文本分类方法及系统

    公开(公告)号:CN116628199A

    公开(公告)日:2023-08-22

    申请号:CN202310520566.6

    申请日:2023-05-10

    Inventor: 王雷 林呈宇 薛聪

    Abstract: 本发明公开一种一种标签语义增强的弱监督文本分类方法及系统,属于机器学习领域,基于BERT弱监督文本分类框架,在类别词表构建阶段,基于Zipf定律加权类别表示实现类别词去噪,利用了语义相似度递减特性去除类别词表中的无关词;在样本标注阶段,基于MASK机制的词类别标注,然后基于自训练模块进行优化分类模型,以样本中的类别指示性单词为桥梁,建立“样本句‑指示词‑类别标签”跨层级语义关联。本发明在词表构建与样本弱标注生成阶段引入了更多降低标签噪声的算法,以达到标签语义增强的效果,在不同语种环境中显著提升文本分类效果。

    一种跨媒体的事件抽取方法

    公开(公告)号:CN106484767A

    公开(公告)日:2017-03-08

    申请号:CN201610809600.1

    申请日:2016-09-08

    CPC classification number: G06F16/3344 G06F17/2785 G06Q50/01

    Abstract: 本发明公开了一种跨媒体的事件抽取方法。本方法为:设置种子事件特征库及所需的知识数据;从可信新闻源中采集新闻网页,并提取新闻文本及元数据信息;从每则新闻文本中抽取事件要素信息,生成一初始事件集合;计算初始事件各要素在事件刻画中的重要程度,生成事件初始概要框架;基于事件初始概要框架中的各要素搜索社交网络消息文本,生成候选消息集合;根据候选消息的概要框架与事件概要框架的相似度对候选消息进行过滤,得到初始事件对应的消息队列;将事件初始概要框架中的事件要素和消息队列中存在而初始概要框架中不存在的事件要素生成完备事件数据。本发明能够在海量跨媒体数据环境中实现重大事件的精确抽取。

    一种实时检测RGB视频中的3D手与未知物体交互的方法和装置

    公开(公告)号:CN112199994B

    公开(公告)日:2023-05-12

    申请号:CN202010916742.4

    申请日:2020-09-03

    Abstract: 本发明涉及一种实时检测RGB视频中的3D手与未知物体交互的方法和装置。该方法的步骤包括:以视频帧作为输入训练卷积神经网络,卷积神经网络预测每帧图像的3D手姿势、6D物体姿态、手部动作和物体类别;以卷积神经网络检测到的3D手姿势、6D物体姿态作为输入训练交互循环神经网络,循环神经网络利用视频中的时序信息得出视频中的手与物体的交互类别;将待检测视频输入训练完成的卷积神经网络和交互循环神经网络,得到视频中每帧图像的3D手姿势、6D物体姿态、手部动作、物体类别和视频中手与物体的交互动作。本发明不需要深度照片或真实物体姿态坐标作为输入,提升了手部动作识别准确率,大大提升了识别范围,更方便应用于生活中。

    一种实时检测RGB视频中的3D手与未知物体交互的方法和装置

    公开(公告)号:CN112199994A

    公开(公告)日:2021-01-08

    申请号:CN202010916742.4

    申请日:2020-09-03

    Abstract: 本发明涉及一种实时检测RGB视频中的3D手与未知物体交互的方法和装置。该方法的步骤包括:以视频帧作为输入训练卷积神经网络,卷积神经网络预测每帧图像的3D手姿势、6D物体姿态、手部动作和物体类别;以卷积神经网络检测到的3D手姿势、6D物体姿态作为输入训练交互循环神经网络,循环神经网络利用视频中的时序信息得出视频中的手与物体的交互类别;将待检测视频输入训练完成的卷积神经网络和交互循环神经网络,得到视频中每帧图像的3D手姿势、6D物体姿态、手部动作、物体类别和视频中手与物体的交互动作。本发明不需要深度照片或真实物体姿态坐标作为输入,提升了手部动作识别准确率,大大提升了识别范围,更方便应用于生活中。

    一种跨媒体的事件抽取方法

    公开(公告)号:CN106484767B

    公开(公告)日:2019-06-21

    申请号:CN201610809600.1

    申请日:2016-09-08

    Abstract: 本发明公开了一种跨媒体的事件抽取方法。本方法为:设置种子事件特征库及所需的知识数据;从可信新闻源中采集新闻网页,并提取新闻文本及元数据信息;从每则新闻文本中抽取事件要素信息,生成一初始事件集合;计算初始事件各要素在事件刻画中的重要程度,生成事件初始概要框架;基于事件初始概要框架中的各要素搜索社交网络消息文本,生成候选消息集合;根据候选消息的概要框架与事件概要框架的相似度对候选消息进行过滤,得到初始事件对应的消息队列;将事件初始概要框架中的事件要素和消息队列中存在而初始概要框架中不存在的事件要素生成完备事件数据。本发明能够在海量跨媒体数据环境中实现重大事件的精确抽取。

    一种基于节点影响力的多关系网络数据量化表示方法

    公开(公告)号:CN109800342A

    公开(公告)日:2019-05-24

    申请号:CN201811524077.3

    申请日:2018-12-13

    Inventor: 薛聪 王炯 彭佳

    Abstract: 本发明公开了一种基于节点影响力的多关系网络数据量化表示方法。本方法为:1)对于某一目标领域的多关系网络,计算该多关系网络的各关系层节点的节点影响力;2)根据各节点的节点影响力设置对应节点的随机游走参数,包括游走长度、游走次数、节点转移概率;然后根据节点的随机游走参数在各关系层进行游走,得到游走序列;3)计算各关系层的初始权重;然后根据不同关系层的权重进行联合训练,得到节点的最终表示向量;其中,各关系层的权重正比于对应层的节点影响力总和。本方法利用节点影响力为游走采样设定更加灵活的参数,从而充分地挖掘同一节点在不同关系层中的特性,同时能够更好地利用关系之间的联系,提高节点表示向量的性能。

Patent Agency Ranking