タグ「SoyLatte」が付けられているもの

RunNutchInEclipseInMac1.0

http://developer.apple.com/java/
によると、Mac OS X 10.4ではオフィシャルなJava1.6が提供されていない。
が、Nutch1.0はJava1.5だとコンパイルが通らないので
(IOExceptionのコンストラクタの引数が違うと怒られる)
SoyLatte - Port of BSD Javaをインストールしておく。
Eclipseはバージョン3.5(GALILEO)を利用。
Preferences > Java > InstalledJREs、CompilerでJava1.6を指定する。

あとはRunNutchInEclipse1.0 - Nutch Wikiの手順に沿って進める。
nutch-default.xmlの中でhttp.agent.nameの設定は必須。
crawl-urlfilter.txtでMY.DOMAIN.NAMEはクローリング対象のドメインに書き換えること。