在建站或销售虚拟商品过程中,可能会使用到第三方网盘,如百度网盘。然而,网盘分享链接可能会失效。如果网站存在大量失效链接,将会对网站用户留存产生较大影响。为解决此问题,比较好的做法是检测链接是否有效。

本文将为您介绍如何使用一款百度网盘链接有效性检测工具,以实现链接有效性批量检测以及Web API检测。

功能介绍

批量检测可以对Excel表单或文本文件中的百度网盘链接进行检测,并自动将检测结果输出到Excel或文本文件中。

Web API接口支持HTTP的GET和POST方法调用,可以使用这些方法在网站中实现访客实时检测功能,只需要在网站上添加相应的HTTP调用地址即可。同时,它还可以在采集器软件中集成,实现采集时的链接状态检测功能。

正式检测前,请在软件中扫码登录网盘帐号,登录后检测功能更稳定。

批量检测

批量检测

 

如图所示。在操作区中,输入文件路径或拖拽多个文件到输入框,多个文件之间用半角逗号","分隔。如果是Excel文件(xlsx格式),需要设置表单名,通过点击下拉框选择表单,再设置输入列和输出列的序号(序号从1开始计数);如果是文本文件,则不需要设置表单。

设置起始检测的行号,也是从1开始计数。并设置最大的检测行数。设置检测的并发数,建议设置为1;设置检测链接的时间间隔,建议设置为3000毫秒,也就是3秒。可以自定义输出文件后缀,输出结果文件不会覆盖原始检测文件。

设置好之后,点击“开始”按钮,然后等待检测结束即可。

检测时,支持一个单元格中存在多个网盘地址的情况,并将根据“设置”中的多链接判断的规则输出结果。

API接口检测

API接口检测

 

如图所示。侦听端口为服务端口,HTTP协议。因此,程序可以运行在您的服务器上。目前软件支持Windows Server 2016以上的系统。

接口返回格式,支持text和json两种格式。可以生成访问密钥,以免接口被探测和窃取盗用。也可以设置运行时自动启动,软件运行后,就会立即开启API服务端口。

在text格式返回时,仅返回具体检测结果的文本,不返回code状态码。json格式返回时,会返回code和msg(检测结果的文本字符串)两个字段。

如果不清楚如何使用接口,也可以点击“接口测试”进行本地接口测试。

接口测试

其他

运行日志。可以查看检测日志,其中包含批量检测和API检测。

检测设置。一般按默认即可。多链接判断,可根据您的个人习惯修改。

设置

 

蜜蜂采集器中集成API检测接口

在采集器的规则中,对相应的标签增加“标签数据二次处理”。

先添加一个“字符编码转换”,并选择百分号编码,以便对标签内容进行URLEncode操作。

再添加一个“内容前后缀”。这里我们使用POST请求,前缀为:http://127.0.0.1:2312/baiduchecker?$$$post_begin$$$key=xxxx&content=,后缀为$$$post_end$$$。如果使用GET请求,标签内容的长度就不能过长,前缀为http://127.0.0.1:2312/baiduchecker?key=xxxx&content=,无后缀。

再添加一个“Http请求”,即可。

蜜蜂采集器中集成API检测接口

 

这里调用API接口后,会替换标签内容的,所以,用于检测链接的标签应该是单独的“检测”标签,仅仅用于检测有效性,不用于采集内容输出。对此检测标签,还可以添加标签内容过滤,比如,不得包含链接失效,则要求所有提取的网盘链接都是有效的。

标签内容过滤

 

至此,我们就可以在自己的采集规则中检测百度网盘链接是否有效了。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
返回
顶部