一种音视频在线虚拟剪辑方法和系统

    公开(公告)号:CN105592356B

    公开(公告)日:2018-07-17

    申请号:CN201410563990.X

    申请日:2014-10-22

    Inventor: 肖诗斌 刘珅

    Abstract: 本发明提供一种精准的音视频在线虚拟剪辑方法,其包括:步骤S10,音视频对象获取;步骤S20,音视频对象转码;步骤S30,用户在线剪辑;步骤S40,音视频对象准确定位;步骤S50,剪辑关联。将剪辑工具嵌入浏览器,采用流媒体增强型定位技术,精准定位到帧,剪辑信息与父视频进行关联,以实现虚拟剪辑。此外,本发明还提供一种精准的音视频在线虚拟剪辑系统,包括:播放器、在线剪辑工具,流媒体服务器、音视频数据处理服务器,数据库三大模块,实现音视频的精准、高效的在线编辑和播放,同时避免音视频的重复存储,提高存储空间有效利用率。

    海量文档分布式检索排重系统和方法

    公开(公告)号:CN103577418A

    公开(公告)日:2014-02-12

    申请号:CN201210256159.0

    申请日:2012-07-24

    Abstract: 一种海量文档分布式检索排重系统,包括文档预处理模块、文档特征计算模块、分布式建库模块、存储模块、分布式检索模块、相似度计算模块。文档特征计算模块根据词对文档的重要程度计算文档特征向量。分布式建库模块根据文档特征向量将文档映射到不同的存储分区。分布式检索模块检索目标文档所属的若干个分区,相似度计算模块计算目标文档与这若干个分区中所有文档的相似度,从而实现海量文档分布式排重操作。所提供的海量文档分布式检索排重系统和方法,借助了分布式系统的思想,将海量文档集分散到若干个子集中,使得排重计算在1个或少数几个子集中进行,减少了相似度计算量,提高了文档排重效率。

    基于图神经网络的文档处理方法、装置和存储介质

    公开(公告)号:CN112214993B

    公开(公告)日:2024-02-06

    申请号:CN202010916293.3

    申请日:2020-09-03

    Abstract: 本发明属于文档处理和检索技术领域,为了解决现有基于传统的关键词检索技术,无法挖掘词语、句子、文档之间的语义关系,检索效果差的技术问题;本发明一种基于图神经网络的文档处理方法、装置、电子装置和非易失性计算机存储介质,所述方法采用基于有监督学习的图神经网络技术将语义词图生成深度语义向量,应用二值化编码器技术,将语义向量转化为二进制编码形式,进而生成字符特征向量,并构建倒排索引;使得处理后的文档,在检索过程中,能够基于字符特征索引和检索技术进行高性能检索与语义匹配,有效地提升语义检索结果相关性。

    一种数据处理方法和系统
    14.
    发明授权

    公开(公告)号:CN107193883B

    公开(公告)日:2020-06-02

    申请号:CN201710285832.6

    申请日:2017-04-27

    Abstract: 本发明实施例提供了一种数据处理方法和系统,其中,所述方法包括:获取待处理的第一数据;根据自然语言处理引擎抽取所述第一数据的关键词序列;根据协同过滤引擎确定所述关键词序列的推荐数据;查询预设的数据库,得到与所述推荐数据匹配的第二数据。本发明实施例利用协同过滤引擎和第一数据的关键词序列确定第一数据的相似数据,即推荐数据,采用协同过滤技术确定第一数据的相似数据,提高了确定相似数据的准确率。当第一数据作为问题数据,第二数据作为答案数据时,本发明实施例也提高了答案推荐的准确率。

    互联网热词挖掘方法及装置

    公开(公告)号:CN104679738B

    公开(公告)日:2018-02-27

    申请号:CN201310607937.0

    申请日:2013-11-27

    Inventor: 肖诗斌 孙丽华

    Abstract: 本发明提供的一种互联网热词挖掘方法,包括:词图和背景库的初始化;实体串和非实体串的识别;字串统计指标更新;字串热度计算;字串热度排序及字串输出。将字串分为实体串和非实体串有针对性的区分识别,并设置背景库实现语料和计算指标的增量更新,提高了热词抽取的准确率和效率。同时,还提供了一种互联网热词挖掘装置,包括:存储单元,实体串识别单元,非实体串识别单元,热词抽取单元。热词抽取单元完成:统计指标的增量更新,字串热度计算,字串排序输出。实现热词有序、高效、准确地抽取。

    标题生成方法和装置
    16.
    发明公开

    公开(公告)号:CN107203509A

    公开(公告)日:2017-09-26

    申请号:CN201710262158.X

    申请日:2017-04-20

    Inventor: 王洪俊 肖诗斌

    CPC classification number: G06F17/2745 G06F17/2775 G06F17/2785

    Abstract: 本发明的实施例提供了一种标题生成方法和装置。所述标题生成方法包括:获取第一新闻集合中各新闻文档的原始标题并拼接成标题文本串,其中,所述第一新闻集合包括关于同一新闻事件的至少一个新闻文档;从所述标题文本串中提取高频词串,并对提取的所述高频词串进行过滤;将经过过滤的所述高频词串中出现频次最高的词串确定为所述第一新闻集合的标题。采用本发明实施例的技术方案,可以自动为新闻文档生成了一个高质量的短标题,保证了标题的语义效果和精炼性,而且降低了短标题生成的计算难度,并具有较高的适应性。

    互联网热词挖掘方法及装置

    公开(公告)号:CN104679738A

    公开(公告)日:2015-06-03

    申请号:CN201310607937.0

    申请日:2013-11-27

    Inventor: 肖诗斌 孙丽华

    Abstract: 本发明提供的一种互联网热词挖掘方法,包括:词图和背景库的初始化;实体串和非实体串的识别;字串统计指标更新;字串热度计算;字串热度排序及字串输出。将字串分为实体串和非实体串有针对性的区分识别,并设置背景库实现语料和计算指标的增量更新,提高了热词抽取的准确率和效率。同时,还提供了一种互联网热词挖掘装置,包括:存储单元,实体串识别单元,非实体串识别单元,热词抽取单元。热词抽取单元完成:统计指标的增量更新,字串热度计算,字串排序输出。实现热词有序、高效、准确地抽取。

    基于图神经网络的文档处理方法、装置和存储介质

    公开(公告)号:CN112214993A

    公开(公告)日:2021-01-12

    申请号:CN202010916293.3

    申请日:2020-09-03

    Abstract: 本发明属于文档处理和检索技术领域,为了解决现有基于传统的关键词检索技术,无法挖掘词语、句子、文档之间的语义关系,检索效果差的技术问题;本发明一种基于图神经网络的文档处理方法、装置、电子装置和非易失性计算机存储介质,所述方法采用基于有监督学习的图神经网络技术将语义词图生成深度语义向量,应用二值化编码器技术,将语义向量转化为二进制编码形式,进而生成字符特征向量,并构建倒排索引;使得处理后的文档,在检索过程中,能够基于字符特征索引和检索技术进行高性能检索与语义匹配,有效地提升语义检索结果相关性。

Patent Agency Ranking