关关采集器使用教程(关关采集器采集规则编写教程)

大家好,张承辉来为大家解答以上问题。关关采集器使用教程,关关采集器采集规则编写教程很多人还不知道,现在让我们一起来看看吧!

1、 在海关收集器的Rules文件夹下创建一个xml文件。为了更容易区分,今天我给大家展示一下写云耀阁的收藏规则,所以我将这个xml文件命名为yunyaoge.xml

2、 单击规则-规则管理器出现,如图所示。单击加载开始编写采集规则。

3、 这是需要填写的内容。

4、 左侧点击这里后,右侧会出现相关说明。很简单。

5、 记住几个键就行了。我给你举个例子。记住几条规则。

6、 ((.|) ?)

7、 d*

8、 今天我们给大家展示一下采集的网站是www.yunyaoge.com,那么我们就打开这个网站的主页,然后在网页的空白处点击右键,然后点击查看源文件(或者网页的源代码在不同的浏览器中显示,但是意思是一样的)。在这里,我可以看到metacharset=’gbk’/表示这个网页是用gbk编码的。让我们在这里填写代码,我们只写gbk。

9、 同理,下面的novelnamenovelauthor,我们可以直接有规律的匹配这些。以novelname为例。我们打开网页http://www.yunyaoge.com/xs/0/88/,点击查看源文件,找到作者meta property=’ og 3360 novel 3360 book _ name ‘ content=’ Holy Market ‘/然后我们写meta property=’ og 3360 novel 3360 book _ name ‘ content='(。)’/如图所示

10、 一步一步写,那么接下来就是测试结果了。如果有问题,测试时会有提示。按照提示修改就行了。

本文到此结束,希望对大家有所帮助。

(0)
上一篇 2022年7月10日
下一篇 2022年7月10日

相关推荐