PHP爬虫之解析页面的方法

发布于 2019-12-31 13:52:54

爬取页面一般比较容易,麻烦的是如何解析。PHP解析页面大概有两种方式:

(1)PHP DOMDocument对象。

(2)正则表达式,个人觉得这种方式比较麻烦。

DOMDocument对象还是很好用的,它提供的方法名跟js中的dom常用的几个方法都是一样的,学习成本不高。

个人在实践中发现,把正则表达式与DOMDocument对象结合起来使用,是最好的。单独使用,往往会比较麻烦。

官方文档:https://secure.php.net/manual/zh/class.domelement.php

只用看DOMElement class 和 DOMNodeList class 就可以解决所有解析问题了。
————————————————
版权声明:本文为CSDN博主「不要忘了为什么出发」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_27988539/article/details/77297742

0 条评论

发布
问题

官网
微信

官方微信