任何需要精确搜索的企业或网站都需要企业搜索引擎,企业搜索引擎可以将大量的数据和信息按需分门别类加以各类复杂的搜索和挖掘,从而让数据发挥更大的作用,帮助企业更全面更快地决策,从而抢占市场先机。与传统的搜索不同,智慧企业搜索是企业内部或在线零售商使用的搜索,可在各行业和部门运作,如金融、医药、政府等。凡是需要精确搜索结果的地方,企业搜索就可以被运用。
基于自然语义的搜索
自然语义搜索技术以传统搜索技术为基础,通过使用日常用语就能找到想要的答案。自然语义搜索的实质是自然语言技术,根据用户所表达语句的真正意图来进行搜索,以更准确、更好地返回符合用户需求的搜索结果。 企业搜索引擎覆盖许多不同的垂直行业,例如,金融公司、汽车公司、特别是各种类型电子商务网站, 如网上书城,网上购物网站等。我们所提供的软件从对中文语言的深度理解方面,以及其软件架构所具备的灵活度及可延伸性特点等方面来看具有相当的竞争力,从而能满足客户任一定制化需求及为客户提供日常维护。
基于多种引擎的搜索
智慧企业搜索主要包括三大引擎:爬取引擎、分析索引引擎、搜索引擎。搜索引擎比传统搜索引擎更强大,ECM-智慧企业搜索的搜索引擎不仅仅提供了关键字搜索的功能,也能执行语义搜索。而且还包含了内容分析挖掘的功能,我们可以通过引擎找出感兴趣的任何内容。
爬取引擎爬取的数据源具有多样性,可以爬取常用的数据库、文件系统、互联网、内容管理系统、常用的办公文档等。
分析索引引擎基于UIMA框架之上设计开发的,特别注重了中文的语义分析。
基于UIMA技术的搜索
UIMA(Unstructured Information Management Architecture)是IBM非结构化信息管理的一个体系架构。UIMA 是非结构化信息管理体系结构在字处理文档、电子邮件、视频和其他非结构化信息中搜索特定的文本甚至概念。从而发现、组织和传送有用的知识给客户。在分析非结构化的信息的过程中,应用的算法有统计的方法、基于规则的自然语言处 理(NLP)、信息修复(IR)、机器学习(Machine Learning)和本体论(Ontologies)等。