用于生成用户简档的方法和装置

    公开(公告)号:CN101822042A

    公开(公告)日:2010-09-01

    申请号:CN200880104354.3

    申请日:2008-08-19

    CPC classification number: G06F17/30702

    Abstract: 一种生成用户简档的方法在最初时包括接收(201、203)内容项目的特性描述数据,并且可选地接收对于内容项目的用户偏好。该特性描述数据描述每个内容项目的特性,诸如内容或上下文特性。然后响应于与每个内容项目关联的特性描述数据,将内容项目聚类(205)成内容项目簇。对于每个内容项目簇,响应于与内容项目簇中的每个内容项目关联的特性描述数据和可能的用户偏好,确定(207)簇特性描述数据。然后接收(209)第一内容项目的第一特性描述数据,并且响应于第一特性描述数据和每个内容项目簇的簇特性描述数据的比较,选择(211)第一内容项目簇。响应于第一内容项目簇的第一簇特性描述数据,生成(213)第一内容项目的用户简档。

    一种用户信息过滤方法及装置

    公开(公告)号:CN101616101A

    公开(公告)日:2009-12-30

    申请号:CN200810126362.X

    申请日:2008-06-26

    Abstract: 本发明公开了一种用户信息过滤方法,包括以下步骤:设置用户关键词、特征数据与对目标用户信息的过滤方式的对应关系;获取目标用户的关键词及特征数据;根据所述目标用户的关键字及特征数据查找所述对应关系中的过滤方式,根据所述过滤方式对所述目标用户信息进行过滤。本发明采用了根据具体关键词和用户特征数据等对目标用户进行判断的方法,可以从用户行为的多个角度对用户行为特征进行判断,并根据不同的目标用户采用不同的处理方式,提高了目标用户信息识别的准确率,增强了用户信息安全机制。

    信息提供系统
    63.
    发明公开

    公开(公告)号:CN101563701A

    公开(公告)日:2009-10-21

    申请号:CN200780046985.X

    申请日:2007-11-06

    CPC classification number: G06F17/30867 G06F17/30702 G06Q30/02 G06Q30/0201

    Abstract: 本发明公开了信息提供系统,其可正确地掌握各用户的喜好,提供正确反映用户的喜好的信息。向各用户提供准备在店铺信息存储部(100)内的店铺信息。在用户喜好信息存储部(110)中按照各用户存储包括关于各种类的特征项目的喜好值的用户喜好信息(T),在店铺评价信息存储部(120)中按照各店铺存储包括关于该种类的特征项目的评价值的店铺评价信息(E)。店铺信息提供部(130)选择具有符合用户喜好信息(T)的店铺评价信息(E)的店铺信息并提供给用户。当用户浏览指定的店铺信息、或利用指定的店铺时,将该指定的店铺作为关注店铺存储的关注店铺记录部(150)中。喜好值更新部(140)根据存储的关注店铺的店铺评价信息(E)更新用户喜好信息(T)。

    用于机器学习文档相关性函数的方法与装置

    公开(公告)号:CN1826597A

    公开(公告)日:2006-08-30

    申请号:CN200480017468.6

    申请日:2004-04-23

    Abstract: 本发明提供了一种确定文档相关性函数的方法与计算机程序产品,该文档相关性函数用于估计数据库中的文档关于查询的相关性分数。对于多个测试查询中的每个测试查询,收集相应的结果文档集。对于每个测试查询,选择所述相应结果集中的文档子集,并且训练相关性分数集被分配给该子集中的文档。在一个实施例中,至少一些训练相关性分数是由人类主观认识分配的,所述人类主观认识确定所提交的文档关于对应查询的个体相关性分数。最后,基于所述多个测试查询、所述文档子集以及所述训练相关性分数集,确定相关性函数。

    一种基于多特征的跨语言剽窃检测方法

    公开(公告)号:CN107862045A

    公开(公告)日:2018-03-30

    申请号:CN201711084337.5

    申请日:2017-11-07

    Abstract: 本发明提供的是一种基于多特征的跨语言剽窃检测方法。(1)构建语料库;(2)译文特征的构建,根据翻译文章普遍出现的欧化现象和翻译体问题进行了译文特征构建,通过特征选择的方式对特征进行清洗筛选出有效特征,过滤无效特征或者效果不明显的特征;(3)特征选择,从诸多特征中选择出若干有效特征来进行分类器的训练,进而区分某一篇或某几篇中文文章是否存在跨语言剽窃问题;(4)基于特征对应的剽窃检测,针对中文的特征,进行英文特征的准确对应,并根据译文特征和结构特征对应进行剽窃结果的过滤和生成,通过WordNet进行剽窃结果的最终确认。本发明能够根据从译文挖掘出的多种特征来解决跨语言剽窃问题。

    一种基于序列标注的事件抽取方法

    公开(公告)号:CN107797993A

    公开(公告)日:2018-03-13

    申请号:CN201711113722.8

    申请日:2017-11-13

    Inventor: 赵二超 韩伟

    CPC classification number: G06F17/278 G06F17/30702

    Abstract: 本发明公开了一种基于序列标注的事件抽取方法,包括以下几个步骤:步骤1,对输入文本进行预处理;步骤2,利用LSTM+CRF网络对文本的字序列进行标注;步骤3,归并标注结果,得到事件元素;步骤4,将提取出的事件及其元素填充到设计好的模板,形成一句话描述。其主要解决的问题是如何从上市公司各类重大事项的公告中,抽取出贷款、合并等事件并给出人类语言形式描述。节约了金融从业人员每天阅读大量的公司公告的人力成本。

Patent Agency Ranking