一种视频播放的跳转导航方法

    公开(公告)号:CN111212317A

    公开(公告)日:2020-05-29

    申请号:CN202010043570.4

    申请日:2020-01-15

    Applicant: 清华大学

    Abstract: 本发明公开了一种视频播放的跳转导航方法,根据视频特征将视频分割为多个视频子段,视频特征包括视频文本,对每个视频子段进行文字总结,并在播放界面生成相应的时间进度条节点和至少一条相应文字标签,当相应文字标签被选取后则跳转至对应的时间进度条节点;本申请技术方案可以自动对每个视频子段进行文字总结,更加自动化、节约时间,可以作为人工标注的辅助工具;本申请技术方案是基于视频内容的,不会被观看流量影响;本申请技术方案对视频内容进行总结,使视频浏览者可以快速的跳转到感兴趣的内容和片段,适用于演讲、课堂、讲座等文字内容居多的视频,替视频制作者节约标注时间,替观众节约浏览时间。

    基于在线数据的消费者物价指数确定系统

    公开(公告)号:CN108009842A

    公开(公告)日:2018-05-08

    申请号:CN201710993527.2

    申请日:2017-10-23

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于在线数据的消费者物价指数确定系统,包括商品篮子确定模块、数据采集模块和物价指数确定模块。商品篮子确定模块用于确定商品篮子;数据采集模块用于在网络平台上采集商品篮子内各规格品的价格数据;物价指数确定模块用于根据价格数据和商品篮子内的各级商品类别对应的权重,确定消费者物价指数。本发明通过在线对商品篮子内的各规格品价格进行采集,并依据采集到的线上商品价格来确定消费者物价指数,从而对线上的商品和服务价格水平变动情况进行反映,节省了大量人力物力的同时又减少了人为客观因素的干扰。

    一种基于定义与关系的术语抽取方法

    公开(公告)号:CN107577670A

    公开(公告)日:2018-01-12

    申请号:CN201710833633.4

    申请日:2017-09-15

    Applicant: 清华大学

    Abstract: 本发明属于文本挖掘领域,尤其涉及一种基于定义与关系的术语抽取方法,该方法以挖掘术语定义与术语关系为主,综合构词规则和边界检测,其首先对文本进行定义抽取,从定义中生成初始的优质术语候补,之后会根据术语关系不断对术语候补进行扩充。本发明提出的上述术语抽取方法有利于提高对低频术语的辨识能力和对于通用性较高术语、长字数术语的抽取能力。

    一种获取体系结构描述语言的方法和一种建模工具

    公开(公告)号:CN102270137A

    公开(公告)日:2011-12-07

    申请号:CN201110228837.8

    申请日:2011-08-10

    Applicant: 清华大学

    Abstract: 本发明提供了一种获取体系结构描述语言的方法和一种建模工具,所述的方法包括:首先制定一种能描述产品线变化性的DPOSPL ADL元模型;然后,在DPOSPL ADL中引入变量定义和赋值语法;最后,根据体系结构模型的约束,制定DPOSPL ADL的描述规范;所述的体系结构描述语言支持领域分析后的需求特征模型到体系架构模型的转换,可针对需求特征模型中的可变点快速开发出针对特定需求的实际产品的体系架构。

    基于新闻事件的关系分析方法及装置

    公开(公告)号:CN113158672B

    公开(公告)日:2024-11-08

    申请号:CN202110326769.2

    申请日:2021-03-26

    Applicant: 清华大学

    Abstract: 本发明提供一种基于新闻事件的关系分析方法及装置,其中方法包括:获取多篇新闻文本;对多篇新闻文本进行聚类,得到聚类后的多个新闻事件;对多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取、实体与事件关系抽取,根据实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果、实体与事件关系抽取结果进行关联分析得到分析结果。本发明通过原始新闻文本聚类实现新闻事件级别分析,得到多个事件,再通过对事件文本抽取实体、实体关系、事件关系、事件与实体的关系。进而通过实体链接,将实体背景知识进行补充,实现对事件的深层次挖掘,从而使读者能够获得更全面和深入的信息。

    跨域推荐方法、装置、电子设备及存储介质

    公开(公告)号:CN115098692B

    公开(公告)日:2024-09-20

    申请号:CN202210614778.6

    申请日:2022-05-30

    Applicant: 清华大学

    Abstract: 本发明提供一种跨域推荐方法、装置、电子设备及存储介质,其中,所述方法应用于数据稀疏的目标域,目标域的目标域实体包括待推荐用户实体和待推荐商品实体,所述方法包括:获取知识图谱和源域,其中,源域中的源域实体包括源域用户实体和源域商品实体;基于知识图谱,对目标域实体和源域实体进行转换,得到目标域实体向量和源域实体向量;基于目标域实体向量和源域实体向量,通过图注意力模型得到待推荐用户实体的融合偏好特征;基于待推荐用户实体的融合偏好特征,通过跨域贝叶斯机制进行推荐,得到待推荐用户实体关于待推荐商品实体的推荐排序。通过本发明提高了对待推荐用户实体进行商品实体推荐的推荐效率。

    融合关系短语知识的关系抽取方法、装置和电子设备

    公开(公告)号:CN113705237B

    公开(公告)日:2024-07-23

    申请号:CN202110881415.4

    申请日:2021-08-02

    Applicant: 清华大学

    Abstract: 本发明提供一种融合关系短语知识的关系抽取方法、装置和电子设备,包括:确定待抽取关系语句,以及该语句中的待抽取关系的两个实体的位置信息;将所述待抽取关系语句和所述位置信息输入抽取模型,输出所述两个实体的关系类型;其中,所述抽取模型是基于样本语句、对应的样本头尾实体位置和对应的头尾实体间关系类型标签进行训练得到的,所述抽取模型训练时的网络结构包括语句编码器、协同切割关系短语表示网络、关系记忆网络和关系短语类别分类网络。本发明提供的方法、装置和电子设备,实现了融合关系短语的语义信息到关系类型中,提高了语句中关系类型抽取的准确率。

    问答推理方法及装置
    78.
    发明授权

    公开(公告)号:CN114817512B

    公开(公告)日:2023-03-14

    申请号:CN202210738644.5

    申请日:2022-06-28

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。

    一种实体记录匹配方法及系统

    公开(公告)号:CN114781471B

    公开(公告)日:2022-12-27

    申请号:CN202110614418.1

    申请日:2021-06-02

    Applicant: 清华大学

    Abstract: 本发明提供一种实体记录匹配方法及系统,该方法包括:获取待匹配的实体记录集合,所述实体记录集合中的实体记录是由实体的属性和属性值组成的;将所述实体记录集合输入到训练好的实体记录匹配模型,得到所述实体记录集合中实体记录之间的匹配结果,其中,所述训练好的实体记录匹配模型是由自监督学习方法训练后的神经网络和决策树算法训练后的决策树模型构建得到的。本发明通过神经网络对实体转换为属性值向量,利用自动构建的关键属性树,克服深度学习可解释性差的缺点,能将学习到的关键属性树转化成匹配规则,运用到其他数据集中;同时,本发明对应模型的训练仅需要少量的标记实体记录对,克服了现有方法需要大量标记实体记录对的缺点。

    开放式信息抽取方法、装置、电子设备及存储介质

    公开(公告)号:CN112527981B

    公开(公告)日:2022-11-11

    申请号:CN202011312007.9

    申请日:2020-11-20

    Applicant: 清华大学

    Abstract: 本发明提供一种开放式信息抽取方法、装置、电子设备及存储介质,其中,该方法包括:根据预设的知识图谱,获取目标技术领域的文档集中每一待提取文档中的候选三元组;根据各待提取文档中的候选三元组,建立图表示模型,根据图表示模型,获取每一待提取文档中每一候选三元组的重要性分值;对于每一待提取文档,根据每一待提取文档中各候选三元组的重要性分值,获取抽取结果。本发明提供的开放式信息抽取方法、装置、电子设备及存储介质,根据从目标技术领域的文档集中提取出的各候选三元组,建立图表示模型,根据图表示模型,获取候选三元组的重要性分值,对待提取文档中的候选三元组进行筛选,获取抽取结果,能提高开放式信息抽取的准确率。

Patent Agency Ranking