読者です 読者をやめる 読者になる 読者になる

wikipedia を、テストデータにする

Hadoopとかのテストデータが欲しかったので。

Textにする

wp2txtというソフトがあるので、それを使います。
WP2TXT: Wikipedia to Text Converter
http://rubyforge.org/projects/wp2txt/

dmgを落としてきて、使用しました。

終了すると、ディレクトリに、指定したサイズのtxtが、沢山出来ます。