nokogiriとMechanizeでスクレイピングその2

前回の続き
nokogiriとMechanizeでスクレイピングその1 – moyashidaisuke's diary

文字コードをちゃんと設定してないせいか、\nがたくさん出てる。=>gsubで無理やり置換しました。

now_updated = div.inner_text.gsub('\n', '')

class指定で取得するときに、div.class の形式だと部分一致で取れる。
div[@class=”class”] だと完全一致になる。
http://www.engineyard.co.jp/blog/2012/getting-started-with-nokogiri/

スクレイピングのスクリプト自体はほぼこれで完成。
残りは、サーバーにのっけて定期的に実行し、どこか(メールとかTwitterとか)に連携する。

コメント

タイトルとURLをコピーしました