网页爬虫
案例分析:img标签无法提取图片,图片文件无法下载的问题分析
img标签无法提取图片,因为src的属性值没有使用引号括起来,导致标签处理时,勾选“文件与图片下载”之后,实际采集并没有下载图片。
如何将蜜蜂采集器的采集数据导出到PDF文件
蜜蜂采集器的采集数据,有几种方法导出到PDF文件。一种是数据编辑窗口的“导出当前页记录”,一种是“发布到文件”中添加文件发布模板。此外,也可以使用“发布到插件”的方式,通过插件发布到PDF文件。
使用蜜蜂采集器对Crypto-JS加密的网页数据进行解密
有些网页会使用JavaScript的加密库Crypto-JS来加密网页数据,如果使用常规的思路进行处理,则非常麻烦,耗时耗力。这里介绍一种可以在蜜蜂采集器中使用的解密方法,供大家参考。
[视频] 使用蜜蜂采集器实现“采集一次再发布到多个站点”的几种方法
蜜蜂采集器2401版本新增了标签名称映射功能,轻松实现一采多发功能。使用蜜蜂采集器实现“采集一次再发布到多个站点”的几种方法。
蜜蜂采集器2308版本对HTTP/2和HTTP/3的功能支持
2308版本中,我们增加了对HTTP/2和HTTP/3的功能支持。目前,HTTP/2已经较为成熟,很多HTTP服务器都支持了HTTP/2。但HTTP/3目前还未完全普及,本软件对其支持也不是很稳定,如果指定HTTP/3协议,可能存在程序崩溃的情况。
使用蜜蜂采集器获取意大利米兰家具展览会参展商企业名录
本文以意大利米兰家具展览会参展商企业名录采集为例,介绍网址采集中的POST翻页采集方法、JSON数据解析方法以及如何发布到Excel文件。
如何将蜜蜂采集器的采集数据发布到Word文档
蜜蜂采集器的采集数据,可以通过“发布到文件”来发布到Word文档,也可以插件发布到Word文档。
使用蜜蜂采集器进行高赞评论的采集与分析
采集器对加减乘除等运算功能支持不够,一般通过调用插件实现复杂功能。也有的采集器支持内置脚本引擎实现加减乘除运算。蜜蜂采集器在当前版本中增加了内置JavaScript脚本的支持,采用V8引擎执行JavaScript脚本,从而实现加减乘除等运算。