Pyhon+lxml+xpath快速实现网页爬虫(比BeautifulSoup好用)
背景 最近因为工作需要写爬虫,以前用过BeautifulSoup,所以很自然的无脑上BeautifulSoup了,不过使用过程中发现BeautifulSoup有一个致命的缺陷,就是不能支持XPath。XPath可以快速在结构化的文档(如XML,HTML)中查……
Stay hungry. Stay foolish.