用于防止垃圾邮件的反馈循环

    公开(公告)号:CN1809821A

    公开(公告)日:2006-07-26

    申请号:CN200480003769.3

    申请日:2004-02-25

    Applicant: 微软公司

    CPC classification number: H04L51/12 G06Q10/107

    Abstract: 本发明提供了便于就在服务器和/或基于客户机的体系结构中防止垃圾邮件而对项目进行分类的反馈循环系统和方法。本发明利用机器学习方法,将其应用于垃圾邮件过滤器,尤其是随机地对传入的电子邮件消息进行采样,从而获得合法和垃圾/兜售信息邮件两者的例子来生成训练数据集。被标识为垃圾邮件战士的用户被要求对其传入电子邮件消息的选择分别是合法邮件还是垃圾邮件进行表决。数据库存储每个邮件和表决事务的属性,诸如用户信息、消息属性和内容摘要以及每个消息的轮询结果等,以生成用于机器学习系统的训练数据。该机器学习系统便于创建改进的垃圾邮件过滤器,它被训练成能识别合法邮件和垃圾邮件两者,并能区分这两者。

    用于预防兜售信息的智能隔离

    公开(公告)号:CN1658572A

    公开(公告)日:2005-08-24

    申请号:CN200510008149.5

    申请日:2005-02-06

    Applicant: 微软公司

    CPC classification number: G06Q10/107 H04L51/12

    Abstract: 本发明提供了一种智能隔离系统和方法,它促进了与预防兜售信息有关的更健壮的分类系统。该发明包括根据分类(兜售信息或好的)阻止看似有问题的、可疑的或者不可信的一些消息。尤其是,该过滤器缺少与这些消息有关的信息并且因此暂时延迟分类。这就为过滤器更新提供了更多的时间,以便达到更准确的分类。可疑消息可以被隔离一个预定时间段,以便允许收集到与这些消息有关的更多的数据。可以使用多个因素来确定消息是否更可能被标记以供进一步分析。也可以使用采用反馈回路系统方式的用户反馈,以便于消息的分类。在某个时间段之后,可以重新开始该消息的分类。

    消息分类系统和方法
    14.
    发明授权

    公开(公告)号:CN1658572B

    公开(公告)日:2013-03-06

    申请号:CN200510008149.5

    申请日:2005-02-06

    Applicant: 微软公司

    CPC classification number: G06Q10/107 H04L51/12

    Abstract: 本发明提供了一种智能隔离系统和方法,它促进了与预防兜售信息有关的更健壮的分类系统。该发明包括根据分类(兜售信息或好的)阻止看似有问题的、可疑的或者不可信的一些消息。尤其是,该过滤器缺少与这些消息有关的信息并且因此暂时延迟分类。这就为过滤器更新提供了更多的时间,以便达到更准确的分类。可疑消息可以被隔离一个预定时间段,以便允许收集到与这些消息有关的更多的数据。可以使用多个因素来确定消息是否更可能被标记以供进一步分析。也可以使用采用反馈回路系统方式的用户反馈,以便于消息的分类。在某个时间段之后,可以重新开始该消息的分类。

    增量反垃圾邮件查找与更新服务

    公开(公告)号:CN1716293B

    公开(公告)日:2012-04-18

    申请号:CN200510082282.5

    申请日:2005-06-29

    Applicant: 微软公司

    CPC classification number: G06Q10/107 H04L51/12

    Abstract: 本发明提供一种便于几乎实时或实时地增量更新垃圾邮件过滤器的独特系统与方法。增量更新可部分地通过差异学习来生成。差异学习涉及基于新数据来训练一新垃圾邮件过滤器,然后寻找该新垃圾邮件过滤器和现有垃圾邮件过滤器之间的差异。差异可至少部分地通过比较参数变化的绝对值(两个过滤器间特征的权重变化)来确定。也可使用诸如参数频率等的其他因素。此外,关于特定特征或消息的可用更新可使用一个或多个查找表或数据库来查找。例如,当增量和/或特征专用更新可用时,它们可由诸如客户机下载。增量更新可被自动提供,或可依照客户机或服务器的偏好根据请求来提供。

    智能自动填充
    18.
    发明公开

    公开(公告)号:CN1696937A

    公开(公告)日:2005-11-16

    申请号:CN200510070040.4

    申请日:2005-04-29

    Applicant: 微软公司

    CPC classification number: G06F17/243 Y10S707/99931 Y10S707/99945

    Abstract: 本发明提供一种独特的系统和方法,能够采用机器学习技术跨各种不同的Web表格自动填充一个或多个字段。特别地,一个或多个工具化工具可收集表格字段的输入或输入项。机器学习可用于学习什么数据对应于哪些字段或哪些类型的字段。输入可被发送回中央储存库,在中央储存库中,其它数据库也可聚集在一起。该输入可提供给机器学习系统,以学习如何预测所希望的输出。可选地或除此之外,可部分地通过观察输入项,然后相应地对自动填充组件进行适配来进行学习。此外,可采用数据库字段的若干特征以及约束来促进数据库输入项到表格值的赋值-特别是在Web表格从未被自动填充系统看到过时。

    垃圾邮件过滤器的模糊化

    公开(公告)号:CN1573780B

    公开(公告)日:2013-03-06

    申请号:CN200410059510.2

    申请日:2004-05-20

    Applicant: 微软公司

    CPC classification number: H04L51/12

    Abstract: 本发明目的提供促进模糊化垃圾邮件过滤系统以阻碍垃圾邮件过滤器的反向工程和/或降低垃圾邮件制造者不断地寻找通过过滤器的消息的方法和系统。该系统包括在划分该消息为垃圾邮件或非垃圾邮件之前,用于随机化消息分值以便模糊该垃圾邮件过滤器的功能的随机化部件。随机化该消息分值可以在被划分为垃圾邮件或非垃圾邮件之前,部分地通过向消息分值加入一个随机数字或伪随机数实现。加入其上的数字可以依赖输入的几种类型的至少之一,如时间、用户、消息内容、消息内容的散列值、和消息特别重要特征的散列值。例如,可选择地,可以采用多个垃圾邮件过滤器而不是单个最好的垃圾邮件过滤器。

Patent Agency Ranking