大家好,张承辉来为大家解答以上问题。关关采集器使用教程,关关采集器采集规则编写教程很多人还不知道,现在让我们一起来看看吧!
1、 在海关收集器的Rules文件夹下创建一个xml文件。为了更容易区分,今天我给大家展示一下写云耀阁的收藏规则,所以我将这个xml文件命名为yunyaoge.xml
2、 单击规则-规则管理器出现,如图所示。单击加载开始编写采集规则。
3、 这是需要填写的内容。
4、 左侧点击这里后,右侧会出现相关说明。很简单。
5、 记住几个键就行了。我给你举个例子。记住几条规则。
6、 ((.|) ?)
7、 d*
8、 今天我们给大家展示一下采集的网站是www.yunyaoge.com,那么我们就打开这个网站的主页,然后在网页的空白处点击右键,然后点击查看源文件(或者网页的源代码在不同的浏览器中显示,但是意思是一样的)。在这里,我可以看到metacharset=’gbk’/表示这个网页是用gbk编码的。让我们在这里填写代码,我们只写gbk。
9、 同理,下面的novelnamenovelauthor,我们可以直接有规律的匹配这些。以novelname为例。我们打开网页http://www.yunyaoge.com/xs/0/88/,点击查看源文件,找到作者meta property=’ og 3360 novel 3360 book _ name ‘ content=’ Holy Market ‘/然后我们写meta property=’ og 3360 novel 3360 book _ name ‘ content='(。)’/如图所示
10、 一步一步写,那么接下来就是测试结果了。如果有问题,测试时会有提示。按照提示修改就行了。
本文到此结束,希望对大家有所帮助。