包括自动分类规则的数据分类流水线

    公开(公告)号:CN102414677B

    公开(公告)日:2016-04-13

    申请号:CN201080018349.8

    申请日:2010-04-14

    CPC classification number: G06F17/30115 G06F17/30082

    Abstract: 描述了通过可扩展的数据处理流水线(包括分类流水线)来处理数据项(例如,文件)以基于数据项的分类来促进对数据项进行管理的技术。发现模块定位要处理的数据项。独立分类流水线获取与每一个被发现的数据项相关联的元数据(属性),而一个或多个分类器基于元数据来分类数据项。独立的策略模块基于其分类将策略应用到每一个数据项。可以基于各种准则来调用多个分类器。预定义排序的分类器、权威性分类器和/或聚合机制处理任何分类冲突。可以提供不同类型的分类器,而每一个分类器都可以对应于自动分类规则;分类器可以直接改变属性(例如,设置分类)或将结果返回到用于改变属性的相对应的规则机制。

Patent Agency Ranking