我试图用Goutte从这个url中获取数据,但是当我尝试用类“empresa”过滤只div时,我得到了整个页面。如何只过滤具有特定类的div?
下面是我的代码:
<html>
<body>
<?php
require __DIR__ . '/vendor/autoload.php';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://sp.cadastrosindustriais.com.br/?consulta=cal%C3%A7ados');
$crawler->filter('div[id="empresa"]')->each(function ($node) {
print $node->text()."\n";
});
?>
</body>
</html>
字符串
1条答案
按热度按时间0ejtzxu11#
你很接近了问题是你的选择。crawler使用jquery style selectors。
下面是您的代码的一个工作示例。我把结果放在一个数组中,以防你想做更多的事情,而不仅仅是转储结果。
字符串
然后,如果要遍历结果,只需执行
foreach($elements as $e)