IBM WebSphere Information Integrator GE OmniFind Edition 8.3 (文档分类):
WebSphere Information Integrator (DB2 II) OmniFind Edition 为加强 intranet、extranet 和公司公众 Web 站点提供了企业级的搜索中间件。它提供了高质量、可伸缩和安全的企业级搜索能力,可为您的员工、合作伙伴和客户,查找出最相关的企业数据。
关键搜索特性:
从 intranet 、extranet、公司公众网站、关系数据库系统、文件系统和内容库这些企业级内容中搜索结果只需次秒级响应时间。
支持的来源包括:HTTP/HTTPS、新闻组 (NNTP)、文件系统、 Domino? 数据库、Microsoft? Exchange public 公共文件夹、DB2 Content Manager、 DB2 UDB、 DB2 UDB for z/OS、 Informix? 和 Oracle 数据库、 文档和 FileNet (通过第三方软件)。还可添加更多的来源。
为公司的内容提供最新的相关算法。
技术和业务获益:
数百万文档和数千用户的规模。
轻松满足企业Java应用程序的安全需要,使得保密信息不会暴露。
方便管理员快速搭建。
在后台运行的分析功能为需要高质量搜索结果的管理员减少了工作量。
提供高度相关的搜索结果和更为丰富的文本分析框架。
为那些可利用现有方法学进行导航和分类的 WebSphere? Portal 客户无缝升级到 DB2 II OmniFind、迁移基于规则的分类准则、并通过 WebSphere Portal Search Center 使外观方面的用户体验相同。
作为高性能搜索、分类学和分类系统的 WebSphere Information Integrator OmniFind Edition 为用户提供了两种不同的方法来对文档分类。第一种方法是基于规则的分类器。对于这种类型的分类器,您可以创建一些规则,这些规则实际上是查询分类学中的每个类别。例如,您可以为一个名为“dental insurance”的类别创建一条规则,它类似于以下查询:
+"dental insurance" -"health insurance" -travel -"life insurance" 基于规则的分类者,例如 WebSphere Information Integrator OmniFind Edition 中的分类者,其速度都比较快,易于设置,并且在类别数量较少时有很好的表现。
对于正在使用 WebSphere Portal 5 的客户,WebSphere Information Integrator OmniFind Edition 还支持预定义的分类学与 WebSphere Portal 中基于模型的分类者的集成。IBM 构建了这样的分类学和分类者,以便针对类别非常多的情况提供较高的准确率。这个分类学包含超过 2700 个类别,对于网页或类似的数据,其中有 2200 多个类别可供对文档以近似人类的准确率进行分类。当然,对于您自己的数据,其准确性可能有所不同。通常,对于关于单个主题、包含至少几段文本和专门编写的文档,可以达到最大的准确率(对于任何分类者,不管是人工分类者还是自动分类者,这一条指导方针通常都是对的。)