2008年8月22日金曜日

 

【PHP】スクレイピングあれこれ(メモ)

PHPでのスクレイピングに役立つライブラリ - (DxD)
ライブラリ、関数とか。
* tidyでHTMLのパースを実現したい - PHPプロ!
Tidy関数。
PHP汎用スクレイピングライブラリを作ってみた - Liner Note
PEAR::HTTP_Client。
PHPでTwitterのBotを作ってみる - uyarinの日記
PEAR::HTTP_Client。
PHP+SimpleXMLElementでTwitterのスクレイピング - GRANADA Hatena @ sotarok
SimpleXMLElement関数。
DOM::loadHTML - 「PHPで街を育てる」の続きの続きの続き - Do You PHP はてな
DOM::loadHTML。
XREAでPHP-Tidyを使うメモComments - ぬっ記
うまくいかなくて泣きたい。
phpによるスクレイピング処理入門
Tidy関数。
Snoopy でHTMLを取得する - bnote
Snoopyライブラリ。Webページの取得(全文・リンクのみ)やアクセスしたページ内のフォームにクエリを送って結果を得られる。便利。
SnoopyとHTTP_Request - ITT-WEB
SnoopyとHTTP_Requestの比較。
[9181] Snoopy(Webブラウザシミュレータ用PHPライブラリ。) - GAC なぜなにGAC->PHP
Snoopyメソッド一部。

参考書

Spidering hacks―ウェブ情報ラクラク取得テクニック101選
Spidering hacks―ウェブ情報ラクラク取得テクニック101選

ラベル:


コメント: コメントを投稿

登録 コメントの投稿 [Atom]



この投稿へのリンク:

リンクを作成



<< ホーム

This page is powered by Blogger. Isn't yours?

登録 投稿 [Atom]

Google