网页爬虫
如何使用蜜蜂采集器的Discuz站点发布模块实现内容发布
Discuz是一款流行的搭建论坛的工具,无需会代码即可搭建一个专属论坛,并且拥有许多插件和应用,可以丰富你的论坛功能。
如何使用蜜蜂采集器的文件下载功能
蜜蜂采集器的文件下载功能介绍,图片水印的使用,下载到本地的路径和服务器端的路径的格式说明。
如何将蜜蜂采集器的采集数据导出到Excel表格
蜜蜂采集器的采集数据,有两种方法导出到Excel文件。一种是数据编辑窗口的“导出当前页记录”,一种是“发布到文件”中添加Excel文件发布模板。
三分钟学会检测百度网盘链接有效性
建站过程中,可能需要使用到百度网盘等第三方网盘。而不少情况下,网盘分享链接可能已经失效。如果网站长期存在大量失效链接,对网站用户留存的影响非常大。对此,比较好的处理方法,就是检测链接是否有效。
案例分析:img标签无法提取图片,图片文件无法下载的问题分析
img标签无法提取图片,因为src的属性值没有使用引号括起来,导致标签处理时,勾选“文件与图片下载”之后,实际采集并没有下载图片。
如何将蜜蜂采集器的采集数据导出到PDF文件
蜜蜂采集器的采集数据,有几种方法导出到PDF文件。一种是数据编辑窗口的“导出当前页记录”,一种是“发布到文件”中添加文件发布模板。此外,也可以使用“发布到插件”的方式,通过插件发布到PDF文件。
使用蜜蜂采集器对Crypto-JS加密的网页数据进行解密
有些网页会使用JavaScript的加密库Crypto-JS来加密网页数据,如果使用常规的思路进行处理,则非常麻烦,耗时耗力。这里介绍一种可以在蜜蜂采集器中使用的解密方法,供大家参考。