-
公开(公告)号:CN106951530B
公开(公告)日:2020-01-17
申请号:CN201710169761.3
申请日:2017-03-21
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/33 , G06F16/36 , G06F40/247
Abstract: 本申请提供了一种事件类型抽取方法和装置,该方法包括:从预置的语料库中提取出候选语料词语;基于所述语料库,确定预置的触发词集合中的基准触发词与所述候选语料词语的关联性,其中,所述基准触发词为通过自动内容抽取技术确定的;对于任意一个基准触发词,将与所述基准触发词关联性满足预设要求的候选语料词语确定为目标触发词,得到至少一个所述目标触发词;确定所述触发词集合中的所述目标触发词的特征;基于目标触发词的特征,对目标触发词进行聚类,得到聚类出的属于不同事件类别的聚类集合。该方法和装置为提高事件抽取的准确性以及增大事件抽取的应用范围提供了可能。
-
公开(公告)号:CN104881404A
公开(公告)日:2015-09-02
申请号:CN201510346311.8
申请日:2015-06-19
Applicant: 苏州大学张家港工业技术研究院
IPC: G06F17/27
Abstract: 本发明公开了一种事件关系检测方法和系统,包括:获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与其逻辑关系对应的测试连接词;确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;通过分析进行分词处理后的测试前置文本和测试后置文本的框架语义,构建测试前置向量及测试后置向量;确定每个测试句子的测试前置向量与测试后置向量组成其测试向量对;获取待测向量对,从全部测试向量对中确定出与待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为待测向量对对应的待测句子的逻辑关系。由此,不仅实现了通用性,获取的检测结果还具有较高准确度。
-
公开(公告)号:CN103838885A
公开(公告)日:2014-06-04
申请号:CN201410126542.3
申请日:2014-03-31
Applicant: 苏州大学
IPC: G06F17/30 , G06F3/0484 , G06Q30/02
CPC classification number: G06F17/30702 , G06F3/0484 , G06Q30/0241 , G06Q30/0251
Abstract: 本发明提供一种面向广告投放的潜在用户检索及用户模型排序方法,包括以下步骤。S1、根据用户在浏览信息过程中的条件反射,对用户进行紧张线索的自动跟踪。S2、识别用户的阅读习惯,并完成面向用户阅读习惯的时序特征挖掘。S3、利用紧张跟踪原理,完成层次用户模型的构建,并进行用户模型排序。S4、将广告推送给进行用户模型排序后排名靠前的用户。
-
公开(公告)号:CN108920565B
公开(公告)日:2022-07-05
申请号:CN201810644268.7
申请日:2018-06-21
Applicant: 苏州大学
IPC: G06F16/583 , G06F16/33 , G06F40/289 , G06F40/30 , G06N3/04
Abstract: 本发明实施例公开了一种图片标题生成方法、装置和计算机可读存储介质,从数据库中抓取图片及其对应的文档信息;利用神经网络中的编解码模型为所述图片生成对应的初始标题;依据预设的匹配规则,计算所述初始标题与其相应的文档信息中语句的匹配度,以确定出所述图片的标题。考虑到与图片对应的文档信息更能准确的反映出图片的特定特征,结合文档信息对图片进行命名,使得到的标题信息量更加丰富,对图片的描述更加准确,有效的避免了现有技术中图片标题过于宽泛,对于同类型图片标题重复率高的情况发生。
-
公开(公告)号:CN106980664A
公开(公告)日:2017-07-25
申请号:CN201710169141.X
申请日:2017-03-21
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开了一种双语可比较语料挖掘方法及装置,通过预先从不同语言的数据库中抓取多个图片以及对应的文字信息,建立包含图片以及文字信息的多模态知识库;将源语言知识库中的图片作为查询图片,在目标语言知识库中进行图片检索,查找出与查询图片相似的目标图片;根据目标图片对应的文字信息与查询图片对应的文字信息,构建双语可比较语料。本申请采用跨媒体信息检索技术,通过图片作为沟通源语言和目标语言的媒介,进而获取源语言在目标端的等价或可比较的文本,为互联网中的双语可比较资源挖掘提供了新方法,解决了特定双语资源稀缺的问题。
-
公开(公告)号:CN104090868B
公开(公告)日:2017-06-16
申请号:CN201410379412.0
申请日:2014-08-04
Applicant: 苏州大学
Abstract: 本申请公开了一种隐式篇章关系的分析方法及系统,其中方法包括:接收输入的包括前置论元和后置论元的待测隐式论元实例,在语料库中筛选与其具有语义平行性且包含预设连接线索词的显式论元实例,计算每个显式论元实例与待测隐式论元实例的语义平行度,按照第一预设规则筛选出若干个显式论元实例,确定为平行显式论元实例集合,计算每个平行显式论元实例的篇章关系的置信度,至少利用每个平行显式论元实例的语义平行度、篇章关系置信度及第二预设规则,计算平行显式论元实例集合中每一类篇章关系与待测隐式论元实例的篇章关系的平行概率,将平行概率最大的一类篇章关系确定为待测隐式论元实例的篇章关系。实现了对于隐式篇章关系的识别的目的。
-
公开(公告)号:CN103810303B
公开(公告)日:2017-01-18
申请号:CN201410101483.4
申请日:2014-03-18
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 一种基于焦点对象识别和主题语义的图像搜索方法及系统。所述方法包括以下步骤。S1、对待搜索图像进行底层特征语义提取,并形成高维特征向量空间后,进行图像分割,获得待搜索图像的元素。S2、将待搜索图像的元素进行元素识别后抽象至语义概念层,并根据不同元素的相对距离及共现概率,判断待搜索图像中的不同元素是否相关,若是,将相关元素组合成对象。S3、计算对象的相对空间位置及占比面积,并计算各对象的兴趣指数及重要指数,根据计算结果,从不同对象中识别出焦点对象。S4、根据焦点对象,构建待搜索图像的主题语义模型,并获取具有焦点对象的现有图像,通过KL距离度量待搜索图像与现有图像之间的相似度,并输出相似度较高的现有图像。
-
公开(公告)号:CN104090868A
公开(公告)日:2014-10-08
申请号:CN201410379412.0
申请日:2014-08-04
Applicant: 苏州大学
Abstract: 本申请公开了一种隐式篇章关系的分析方法及系统,其中方法包括:接收输入的包括前置论元和后置论元的待测隐式论元实例,在语料库中筛选与其具有语义平行性且包含预设连接线索词的显式论元实例,计算每个显式论元实例与待测隐式论元实例的语义平行度,按照第一预设规则筛选出若干个显式论元实例,确定为平行显式论元实例集合,计算每个平行显式论元实例的篇章关系的置信度,至少利用每个平行显式论元实例的语义平行度、篇章关系置信度及第二预设规则,计算平行显式论元实例集合中每一类篇章关系与待测隐式论元实例的篇章关系的平行概率,将平行概率最大的一类篇章关系确定为待测隐式论元实例的篇章关系。实现了对于隐式篇章关系的识别的目的。
-
公开(公告)号:CN109446526A
公开(公告)日:2019-03-08
申请号:CN201811258016.7
申请日:2018-10-26
Applicant: 苏州大学
IPC: G06F17/27 , G06F16/951 , G06F16/35
Abstract: 本发明实施例公开了一种隐式篇章关系语料库的构建方法、装置和计算机可读存储介质,获取疑问句标题及其对应的文档信息;根据篇章关系和疑问句模板的对应关系,对各疑问句标题进行篇章关系标注;利用答案检索技术从各疑问句标题相对应的文档信息中抽取答案;对各疑问句标题及其对应的答案进行句法分析,将各疑问句标题转化为陈述句标题;从各陈述句标题中抽取篇章论元,并依据陈述句标题和疑问句标题的对应关系以及各疑问句标题所标注的篇章关系,构建隐式篇章关系语料库。实现了对疑问句标题的自动化标注,降低了对人力资源的消耗。从而依据标注好的疑问句标题,可以构建大规模的隐式篇章关系语料库。
-
公开(公告)号:CN108804428A
公开(公告)日:2018-11-13
申请号:CN201810600694.0
申请日:2018-06-12
Applicant: 苏州大学
IPC: G06F17/28
CPC classification number: G06F17/289 , G06F17/2872
Abstract: 本申请公开了一种译文中术语错译的纠正方法,所述纠正方法获取第一译文中目标术语的原翻译文本,并从训练集中获取与所述目标术语对应的候选翻译,将所有所述候选翻译设置为伪翻译文本;将每一个伪翻译文本分别替换第一译文中所述原翻译文本得到N个第二译文,并对第一译文和所有第二译文执行回译操作得到N+1个回译文本;将源文本和所有回译文本进行文本比较确定第一译文的翻译准确程度,并根据翻译准确程度纠正目标术语的原翻译文本。本方法能够在不依赖大量领域内资源的前提下实现机器翻译中领域术语的错译纠正。本申请还公开了一种译文中术语错译的纠正系统、一种计算机可读存储介质及一种译文中术语错译的纠正装置,具有以上有益效果。
-
-
-
-
-
-
-
-
-