あれほど恋い焦がれていたRubyですが
最近、もっともよく使う言語はRubyです。でも、そんなに詳しい訳じゃなくて、ささっと書けて正規表現やネットのアクセスができることが理由です。Javaは次点くらいで使うけど、こっちはレンタルサーバでJavaが使えないっぽいので敬遠しています。
あんまりGoogleの広告が酷いので、ここんとこ何とかしてやろうと思ったのですが、ちょっとした事情でPythonに浮気しようかななんて気分に。
やりたいことは、クローラーを作ってHTMLを拾いまくり、そこからAdsenseを抜き出して広告先のリンクを得る。さらに、PageRankを計算して、だめぽなページの場合はブラックリストに載せていくというもの。
WWW::Mechanizeが使えない
WWW::Mechanizeというライブラリを使うとWebページのアクセスが簡単に行えるらしい。今までは普通にhttpで接続して得られたページを正規表現で、あんなことや、こんなことしていたのだけど、これは便利そう。使ってみたいと思ってテスト。しかし、
in `require’: no such file to load — hpricot (LoadError)
となって全然ダメ。findでどこにインストールされているか探して、フルパスでrequireしたり、RubyやGemをインストールしなおしたり、それでもだめで、わー、おまえなんかうんざりだとなったわけです。
けんかの原因は意外なほど単純なもので
最初に
require ‘rubygems’
しておけば全て解決だった。なんだ、そんなことなのか。
最近のコメント