智能信息抽取系统Webvert是一种新型的信息检索系统。如下图所示Webvert可以自动地从指定的Web网页中抽取感兴趣的信息,并将抽取结果以结构化的形式存入数据库。Webvert不仅可以用于商品信息比较、股市信息提取,还可以应用于企业情报获取、个性化信息服务、信息集成、网站监控、Web数据逆向工程等等。
Webvert系统的主要特点:1)提供了两种生成抽取规则的方式:基于图形用户界面的规则生成方式和基于规则学习算法的生成方式;2)根据用户提供的检索规则,系统能够自动地搜索同主题相关的网页;3)根据用户提供的检索规则和相应的抽取规则可以自动完成数据抽取和数据存储任务;4)支持抽取数据的统计分析,对于抽取后存储在数据库中的历史数据,通过用户配置相应的参数,系统自动生成直观的图形(柱状图、折线图等),显示统计结果。