ブックスキャンにスキャンを依頼してみた

広告

アメリカにいながら日本の本が読みたくなって。

ニューヨークでは倍くらい値段が高いものの紀伊國屋で日本の本は結構手に入る。しかし外国にいて日本の本を読みたいが電子書籍で出ていない場合にはスキャン業者を利用するというのはよくある需要ではないだろうか。

追いつかない。

勉強が全く追いつく様子が見えません。教科書を読んで適当に授業を受けていればいいと言う感じではなく、留学生の自分にとってはきちんとTutorialの準備をして、アサインメントをこなして、教科書の重要なポイントを暗記すると言うことをしていかなくてはならないのですが、生来の勉強下手な自分の学力的限界のせいで、毎日追い立てられるように生活しております。

最初は、気合を入れてばばっと教科書を一通り通読し、その後アサインメントやプレゼンの準備などに力を入れようと思っていたのですが、日本語とは違うので教科書をきちんと理解して読むのも一苦労と言った感じです。毎日毎日、今日も予定通りには進まなかった、アサインメントの準備が出来てない・・・と言う不安に包まれながら、糞寒い中、薄い布団に包まって、硬いマットレスの上で背中の痛みを感じながら寝ています。

はてさて、どうしたものかと言う事で、勉強の方針を変えることしかないだろうなと言う結論に落ち着きました。何度も何度も教科書を読むと言う雪だるま方式は、最終的に高速で一冊の教科書を終わらせられると言うのが利点ですが、そのようになるまでかなり時間がかかります。そういったわけで、各週ごとに割り当てられた課題、読まなければならない教科書の範囲をしっかり理解して、一歩一歩積み上げていく方式の方が、この時間的余裕の無さでは向いていると言った感じでしょうか。何故か、僕のブログを見ている人は意外や意外に高学歴の人が多かったりするので、勉強方法のTIPSなどをご教授していただけるとありがたい。

日本人が現地の教科書だけで何とかするのも英語力をつけるためにはいいのかも知れないけど、期限が決まっているとただきついだけということもある。幸いにして日本は国力が強いこともあって日本語で書かれた情報が豊富にある。出版社の頭が固すぎてなかなか電子書籍が出ないけど、Amazonがそろそろ乗り込むらしいから状況は変わるかも知れない。ともあれ、読むスピードを高速化したければ該当の本の日本語訳がないか探すか、あるいは類似の本を探すといいのではないかと思う。おいらのいた学校でアカデミックエッセイの教師の指導力不足だと感じたけれど、紀伊國屋で適当な本を立ち読みしたらそれがすごく助けになった。日本には良質な情報がたくさんある。でも本を手に入れるのは結構面倒くさい。

その解決策の1つがスキャン業者だろうと思う。そういうわけで、文法の本が欲しくて

を古本で注文し、またブックスキャンという業者に依頼をしてみた。

ブックスキャンでは基本1冊100円であるが、250ページを超える場合は2冊、3冊と注文して欲しいとあった。表現ロイヤルは728ページあるというので、3冊ぶんの300円が必要だった。さらにOCRオプションが1冊ぶんで100円なので合計300円。ファイル名変更オプションなるものが1冊ぶんで50円なので150円。これは不要だったかも知れない。ともあれ750円+税と意外と高くついた。

お金を支払うと管理番号を貰えるので、あとはAmazonから発送先をブックスキャンにして、名前のところに管理番号をつけて発注すれば受け取ってもらえる。6月27日にお金を払い、予定日で7月30日のスキャン開始で、実際には7月31日になった。具体的な作業は

作業端末番号 状況 更新日時
端末61 作業に使用する端末準備中(クリーニング・確認)


書籍の確認、スキャナーのレンズクリーニング、ダンボールの開封、冊数確認作業を行っております。
2012年7月31日 19:22
端末61 書籍スキャン中


書籍の確認、スキャン作業を行っております。
2012年7月31日 19:22
端末61 作業サーバーへデータをアップ中


スキャンしたデータを作業用サーバーへ転送中です。
2012年7月31日 19:26
端末61 スキャンしたPDFの全ページチェック中


スキャンが完了したPDFの全ページを目視チェックを行っております。名前変更オプションが選択されている場合には、同時に作業されます。また、この行程で不備が発見されましたら、納品前に書籍単位で再スキャンされます。
2012年7月31日 19:27
端末999 書籍OCR中


書籍のOCRを行っております。1冊分あたり約10分程度と非常に時間のかかる処理です。
2012年8月3日 15:50
端末999 サーバーへデータをアップ中


マイページからダウンロード頂くためのサーバーへ転送作業を行っております。次の行程で承認されませんとダウンロードは出来ません。
2012年8月3日 15:50

のような感じ。「スキャンしたPDFの全ページチェック中」が長かった。よほど念入りにチェックしてくれたのだろうか。「書籍のOCRを行っております。1冊分あたり約10分程度と非常に時間のかかる処理です」というけど、1冊10分はちっとも長くなく、むしろチェックの方がそんなにかかるの?ってくらいだった。ぱらぱら眺める感じで700ページだと10分もあれば見終わると思うけど、なんで3日もかかったのだろうか。

仕上がりはこんな感じ(著作権法32条に基づく引用)

PDFを300dpiでPNGに書き出したので厳密に同じではないけど、だいたいこんな品質。自分でドキュメントスキャナを使ったのとあまり変わらないけど、読むには十分な品質。該当部分のOCR結果は

10B状 態動詞 ずっと継続している状態を表すのがふつうだから,通常,進行形にならない。
(1)知覚や認識を表す状態動詞一一 hear(聞 こえる).know(知っている),scc (見 える),smcll(に おいがする)な ど。
You can see thc EInpire State Building fl・ om hcrc (こ こからエンバイア・ステート・ビルが見えます)
●seeの場合,自 然に目に入るのであつて,意識的に眺めるのではない。
(2)存在や関係を表す状態動:可 ―― be(~である),belong(′ο)((~に)属して いる),contain(入れている),have(持っている),includc(含んでいる),own (所有している),rcscmblc(似ている),stand(立っている)など。
She ownsthc housc jointly with hcr husband (彼女はその家を夫と共有名義で所有している)
1「状態Jを表す動詞とされていても,実際には動作の性質も含んでいる wear(身 につけ ている).live(住んでいる)などは,状態の継続性を強調するときは,She always wears black dothes(彼女はいつも黒い服を着ている)のように単純形にするが,「た またま今着ているJという「一時的な状態Jを表すときには She is wea百 ng a yellow 丁―shin thも mOrning(彼女は2朝墜黄色のTシャツを着ている)のように進行形にす る。なお,「身につけるJと いう動作は put onで 表す。
2 動作動詞も,「現在時制Jでは「習慣という状態Jを意味する。たとえば,He walks to school(彼は徒歩通学です)というような場合,通学には「歩く」という動作が決まつ て繰り返されることから,習慣という1つの状態になつているのである(Op56H H12)。
Heloful Hln1 7 陰日る」と「知つている」
knowと いう動詞は,「 知る」という意味ではない。「知っている」という状態を表し
ている言葉である。「彼女の名前を知った」 というように,「 知る」は「知 らない状態J
から「知っている状態」へ,という過程を表し,英語で言うなら,動作動詞ルα (ま
“ たは∫ ′ο′′′など)を使って,“1物 ′′ (ま たはル ′′′′ο′′など)her name”と 言え
““““ ばよい。
同じように,状態動詞 loveは ,「愛している」状態を表す。もし,た とえば,「 それ は,知 っているよ」や,「 彼女を愛している」などと言うつもりで,日 本語の「~てい
るJにつられて,こ うした状態動詞を現在進行形にして,“Iα いている」といったように,お かしな表現になってしまう。

OCR結果はあまりよくないような気がする。これなら自分でやったほうがいい結果が得られるのではないかな。OCRを何で施したかはわからない。PDFの情報によると単にCanonとだけある。たぶんAcrobatのClearScanでやったほうがいい結果になりそう。そうなると、OCRオプションとかチューニングラボはなくてもいいかな、という感じ。

海外にいながら本を読むという用途に関して言うと時間がかかりすぎる。プレミアム会員になれば高速化されるというけど、月に1万円(50冊ぶんのスキャンを含む)近い出費を考えるとこれもいまいちかなあ。1冊300円でいいから高速に処理してくれれば使い道はありそう。あるいはあらかじめ20冊とか適当な数を注文入れておくというのはどうだろうか。余ったぶんは繰り越せるのならいいのだけど。