绿软基地下载站:您身边最放心的绿色软件下载站!
您现在的位置: 绿软基地 >> 绿软基地 >> 网络工具 >> 网络其它 >> 软件信息

下载地址

熊猫智能采集 v2.6 官方版

  • 软件大小: 12030K
    更新时间:2017/12/7
    软件语言:简体中文
    软件栏目:网络其它
    软件等级:★★★
    软件类别:绿色软件
    授权方式:免费版
    解压密码:www.mt30.com
    官方网站:点击查看
    应用平台:WinXP/Win7/Win8/
    绿软赠言: 乐于分享-手留余香
    0
  • 相关软件

      没有相关软件

软件内容
   熊猫智能采集是一款功能强大的泛采集工具软件,这款熊猫智能采集软件采用熊猫精准搜索引擎的解析内核,采集的对象包括文字内容、图片、flash动画视频、下载文件等等各类网络内容。软件不使用落后低效的正则匹配技术,也不使用第三方内置浏览器访问的技术,使用自己研发的解析引擎,实现对网页源码的仿浏览器解析,需要的朋友欢迎前来下载使用。



 
  熊猫智能采集软件特色:
  1、全方位的采集功能
  采集的对象包括文字内容、图片、flash动画视频、下载文件等等各类网络内容。支持图文混排对象的同时采集。支持结构复杂的采集对象集合,支持复杂多数据库表单,支持跨页面内容合并采集的能力。
  2、面向对象采集,采集对象的内容可以是分散在多个页面(模板页面的深度嵌套访问)熊猫采集是面向对象的,一个采集对象可以拥有许多需要采集的子项属性内容。这些子项属性的内容允许分散在不同的页面内,这些页面可以是需要通过若干次链接才能到达的页面。
  此处所谓“对象”,可以理解为“(需要采集的数据的)数据集合 ”的意思。这个数据集合的内容和范围由用户根据实际需求自行决定,没有特定的要求。也可以将该对象范畴囊括到“标题列表页面”,这属于变通使用的方法,在此不多做赘述。灵活的使用面向对象的方法,不仅可以实现很多复杂的采集需求,更可以使得采集设置过程更为简单。
  3、采集速度快
  熊猫采集的采集速度是采集软件中最快的(之一)。不使用落后低效的正则匹配技术。也不使用第三方内置浏览器访问的技术。使用自己研发的解析引擎,实现对网页源码的仿浏览器解析。分解网页可视化内容元素,在此基础上进行机器学习、批量采集匹配。经实际测试,是传统的正则匹配方式采集速度的2~5倍。是基于第三方内置浏览器采集速度的10~20倍。
  4、结果数据完整度高
  实际采集过程中,由于目标页面存在丰富的内容页面板式的情况,此时就需要使用熊猫独有的“多模板功能”,才能实现完整的采集。同时,看起来页面版面一致的情况下,也可能会存在因为页面内部的少量差异而采集采集匹配失败,此时就需要采集器具有智能容错能力。智能容错能力,是衡量一个采集器是否成熟的基本标志之一。熊猫追求的是采集结果100%的完整。包括有效页面100%的采集,页面中采集的内容100%的采集。只要设置恰当,不会出现采集结果遗漏的情况。——只有熊猫才能让结果如此完整。
  5、JS解析的自动判断识别
  现在很多网页都采用了ajax网页内容动态生成技术。此时仅仅依靠网页源码,并不能获取需要的有效内容。此时就需要对被采集的页面执行JavaScript(JS)解析,获取JS执行后的结果代码。熊猫支持对需要JS解析的页面,执行JS解析,获取JS解析后的实际内容。鉴于执行JS解析的速度效率很低,因此熊猫内置了智能判断功能,自动检查是否需要对被采集的页面执行JS解析,如果不需要的,尽量不使用低效的JS解析模式。

  6、多模板自动适应能力
  很多网站的“内容页面”会存在多个不同种类的模板,因此熊猫采集软件允许每个采集项目可以同时设置多个内容页面参考模板,在采集运行时,系统会自动匹配寻找最合适的参考模板用来分析内容页面。
  7、实时帮助窗口
  在采集项目设置环节,系统会在窗口右上显示与当前配置相关的实时帮助内容,为使用新手提供实时帮助。因此熊猫采集软件的使用可以轻松上手。配合全程智能化辅助能力,即便是第一次接触熊猫采集软件,也可以较轻松实现采集项目的配置工作。
  8、正文和回复内容同时采集的能力
  典型如论坛页面,正文内容在前,若干回复内容在后,或者还存在若干个回复分页存在。熊猫采集可以将这些作为一个“对象”来对待,一并同时完整采集,其配置过程也非常简单