July 12, 2017

Goutteで画像URLを取得

ドキュメントにも書いてあるがぱっとわからなかったので備忘録

Goutteとは

PHPのスクレイピングツールの一種
https://github.com/FriendsOfPHP/Goutte

BrowserKitとかCssSelectorとかDomCrawler
Guzzleとかで構成されている

Goutteのドキュメントはほぼなく、githubのREADMEが一番くわしいかもしれない。
おそらく大体DomCrawlerのドキュメントを見れば諸々は解決できるはず。

本題

画像のURLの取得方法は、DomCrawlerのドキュメントの下記の箇所に書かれている:
https://symfony.com/doc/current/components/dom_crawler.html#images

ImageオブジェクトはgetUri()メソッドを持っており、これを使えばURLを取得可能:

$crawler->filter('img')->image()->getUri();