おいらは本を山ほど持っていますが、海外にいずれ行こうと思うとこの本をどうするか考えなくてはいけません。中には捨てても惜しげのない本もあるのだけど、持って行きたい本も多く、それらを送ると馬鹿らしいコストがかかります。永住するならまだいいけど、根無し草のときにそれはできません。
自炊を決意
というわけで、流行の自炊をすることにしました。自炊というのはググれば出てきますが本をコンピュータの中に取り込むことです。黎明期は色々なやり方を見かけましたが、最近のトレンドは裁断機で本をバッサリ斬ってScanSnapというドキュメントスキャナで読み取ることです。
最近は所有することはダサいという考え方に傾いていて、購入するのではなくスキャレンというレンタルサービスで裁断機とセットで借りてきました。
スキャレンの裁断機は定番の
ではない、より分厚い本もバッサリ斬れるものです。ただ、あんまり使い勝手はよくなかったと思います。本を切断すると切断面が斜めになります。ですから、最初から本を平行四辺形になるように設置してざっくり斬ると途中で歪んでもまっすぐ裁断できます。こうしたノウハウを獲得するまでは大変でした。
次にScanSnap S1500ですが、これは大変役に立ったものの要改善という感じです。まず重送が多すぎます。ただし重送はほぼ100%検知してくれて止まるので、その都度直せばいいのだけど、いちいち直すのは手間がかかります。本の用紙によっては数ページごとに重送して、これなら普通のフラットベッドスキャナのほうが効率がいいよと思うこともありました。
また、かなり引き込む力が強いので紙をくしゃくしゃにしてしまったり、最悪の場合は引き裂いてくれます。
ScanSnapは自炊の追い風でたくさん売れたのだから、次のモデルには潤沢な開発資金を投入して問題を一掃してくれると嬉しいところ。
スキャンの設定
ScanSnapの設定は色々いじっていましたが、最終的にはスーパーファインモードのカラーで決め打ちにしました。自動にするとページによっては白黒、ページによってはグレーになったりして見栄えが悪く、白黒でスキャンしたページはOCRの認識精度が悪い感じがしたため面倒ですが全部カラーで読み取りました。
Actobat XでOCR
スキャンしたばかりの本はファイルサイズも大きく、また表紙を付けたりするのにPDFの編集が必要であるためAcrobat Xのデモ版をダウンロードして30日以内に全部処理してしまいました。複数ファイルを一挙にできるため手間はかかりません。
Acrobat XはClearScanという機能があり、単にOCRするだけではなくファイルサイズもかなり縮めてくれます。ただ、やり過ぎるところもあるのでオリジナルファイルは消さずにどこかに保管して、いつかよりよいOCRが出てきたときにオリジナルをもう一度処理したほうがよいでしょう。とりあえず読めればOKならClearScanでまとめて処理してしまえばOKです。
Acrobat Xのデモを使ったところ、色々と不具合も多く、これはまともに買う気はしないなあと感じました。昔はAdobeのソフトは高品位として定評があったのだけど、最近はずいぶんガタガタのような気がします。三世代アップグレードとか、値上げとか色々とあってユーザが離れていきそう。
おいらはCS3のユーザなのでCS6が出たらアドビ税を払うかどうか判断に迫られることになります。今の品質と価格だとちょっとやる気がしないな。
写真多めの本の傾き
ScanSnap, AcrobatのClearScanともに傾き修正機能がありますが、写真が多めの本だと正しく直してくれないことが多々あります。読み取った結果が四角くなるように直せばいいのにと思うんだけど。
そういうときはPDFではなくJPEGでスキャンして、Capture NX 2というソフトのデモ版で水平になるようにすればOKです。
で、こうなった

本当はもっとたくさん本がありますが、まだ表紙を付けていないとか色々やることがあるのでこんな感じで。
最近のコメント