自适应垃圾消息过滤系统

    公开(公告)号:CN1742266A

    公开(公告)日:2006-03-01

    申请号:CN200380109194.9

    申请日:2003-12-31

    Applicant: 微软公司

    CPC classification number: G06Q10/107 H04L51/12

    Abstract: 本发明涉及一种用于过滤消息的系统——该系统包括一种子过滤器,它具有与其相关联的假肯定率和假否定率。还提供用于过滤消息的新过滤器,该新过滤器是根据种子过滤器的假肯定率和假否定率来评估的,使用用于确定种子过滤器假肯定率和假否定率的数据,来根据阈值确定新过滤器的新假肯定率和新假否定率。如果对该新过滤器存在阈值,使得新假肯定率和新假否定率被一同认为优于种子过滤器的假肯定和假否定率,则使用该新过滤器。

    增量反垃圾邮件查找与更新服务

    公开(公告)号:CN1716293A

    公开(公告)日:2006-01-04

    申请号:CN200510082282.5

    申请日:2005-06-29

    Applicant: 微软公司

    CPC classification number: G06Q10/107 H04L51/12

    Abstract: 本发明提供一种便于几乎实时或实时地增量更新垃圾邮件过滤器的独特系统与方法。增量更新可部分地通过差异学习来生成。差异学习涉及基于新数据来训练一新垃圾邮件过滤器,然后寻找该新垃圾邮件过滤器和现有垃圾邮件过滤器之间的差异。差异可至少部分地通过比较参数变化的绝对值(两个过滤器间特征的权重变化)来确定。也可使用诸如参数频率等的其他因素。此外,关于特定特征或消息的可用更新可使用一个或多个查找表或数据库来查找。例如,当增量和/或特征专用更新可用时,它们可由诸如客户机下载。增量更新可被自动提供,或可依照客户机或服务器的偏好根据请求来提供。

    智能自动填充
    7.
    发明授权

    公开(公告)号:CN1696937B

    公开(公告)日:2011-06-08

    申请号:CN200510070040.4

    申请日:2005-04-29

    Applicant: 微软公司

    CPC classification number: G06F17/243 Y10S707/99931 Y10S707/99945

    Abstract: 本发明提供一种独特的系统和方法,能够采用机器学习技术跨各种不同的web表格自动填充一个或多个字段。特别地,一个或多个工具化工具可收集表格字段的输入或输入项。机器学习可用于学习什么数据对应于哪些字段或哪些类型的字段。输入可被发送回中央储存库,在中央储存库中,其它数据库也可聚集在一起。该输入可提供给机器学习系统,以学习如何预测所希望的输出。可选地或除此之外,可部分地通过观察输入项,然后相应地对自动填充组件进行适配来进行学习。此外,可采用数据库字段的若干特征以及约束来促进数据库输入项到表格值的赋值—特别是在web表格从未被自动填充系统看到过时。

    可扩展电子邮件
    8.
    发明公开

    公开(公告)号:CN101558422A

    公开(公告)日:2009-10-14

    申请号:CN200780022151.5

    申请日:2007-05-03

    Applicant: 微软公司

    CPC classification number: G06Q10/109 G06Q10/107

    Abstract: 提供了用于获得数据的计算机实现的方法和系统。在该方法中,为获得关于另一方的数据,作出关于认证密钥的请求。当在电子邮件中接收到所请求的认证密钥后,该方法和系统自动将该认证密钥作为HTTP、HTTPS或SMTP数据请求的一部分来发送。随后,响应于包含该认证密钥的数据请求,接收所请求的数据。

    用于防止垃圾邮件的反馈循环

    公开(公告)号:CN100472484C

    公开(公告)日:2009-03-25

    申请号:CN200480003769.3

    申请日:2004-02-25

    Applicant: 微软公司

    CPC classification number: H04L51/12 G06Q10/107

    Abstract: 本发明提供了便于就在服务器和/或基于客户机的体系结构中防止垃圾邮件而对项目进行分类的反馈循环系统和方法。本发明利用机器学习方法,将其应用于垃圾邮件过滤器,尤其是随机地对传入的电子邮件消息进行采样,从而获得合法和垃圾/兜售信息邮件两者的例子来生成训练数据集。被标识为垃圾邮件战士的用户被要求对其传入电子邮件消息的选择分别是合法邮件还是垃圾邮件进行表决。数据库存储每个邮件和表决事务的属性,诸如用户信息、消息属性和内容摘要以及每个消息的轮询结果等,以生成用于机器学习系统的训练数据。该机器学习系统便于创建改进的垃圾邮件过滤器,它被训练成能识别合法邮件和垃圾邮件两者,并能区分这两者。

Patent Agency Ranking