信息采集|数据采集|网站采集|垂直搜索引擎|网页抓取|网站抓取 网络掘金者信息采集网站采集首页 网络信息采集软件 信息采集软件下载 信息采集的解决方案 对信息采集软件有问题请到这里来 信息采集软件的帮助信息
您的位置:文章阅读  
网络掘金者
数据处理组件
更新日志
常见问题
新手指南
产品价格
 

全套垂直搜索引擎技术


一、互联网信息采集与处理检索系统


 


1.
  
    
新闻搜索引擎SPIDER


2.
  
    
网页搜索引擎SPIDER


3.
  
    
定向专业搜索SPIDER


4.
  
    
基于视觉的正文智能提取模块(自动正文提取)


5.
  
    
智能摘要提取模块


6.
  
    
去重模块


7.
  
    
智能分类模块


8.
  
    
检索前端类聚模块


9.
  
    
分词模块


10.
   
索引模块


11. 最大可支持10TB以上数据容量,可分层建索引库、分布索引、分布检索、分布采集处理。


 


 


二、WEB结构化信息抽取技术(格式化数据抽取)


 


应用于垂直搜索引擎的重要技术,抽取出结构化数据,对具体网页无依赖,直接针对数据类型进行抽取。


元数据(结构化信息提取) 采集技术:模板方式,作为  WEB结构化信息抽取技术的补充。


 


三、自然语言的结构化信息抽取技术


 


应用于垂直搜索引擎,情报分析处理(科研产品)


 


 


 


 


 


 


如有兴趣,请联系我们 jin@bizpush.com

电话  025-84213492 13813013432


 




上一篇:垂直搜索引擎的选型
下一篇:自然语言的结构化信息抽取[科研阶段]

 

南京投石科技 | 投石新闻 | 产品与服务 | 合作伙伴与客户 | 联系我们 | 信息采集软件

Copyright©2006-2008 Bizpush.Com All Rights Reserved 版权所有·南京投石科技有限公司

苏ICP备06022757号 电信增值业务经营许可证编号:苏B2-20050188