テキストーデータならば検索も容易だ

2011-03-08

新潮社のカセットブックやCD‐ROM「新潮文庫の100冊」では朗読が大きな反響を呼んだが、テキスト読み上げソフトを使うなど「朗読の自動化」も今後できるようになるだろう。将来のさまざまな可能性のためにはテキストーデータでデジタル化することが重要だ。しかし、電子書籍実験では画像データ化を第一に考えており、新潮社のこうした考えとは相いれなかった。村瀬氏らのいる建物の一階は、いわばデジタル化のための「工場」になっていた。アルバイトを使って本のページの汚れをホワイトでつぶし、それをスキャンして、OCRでテキストこアークにコンバートした。二、三種類の校正ソフトや社外校閲をしたうえで、ボイジャーという会社が提供していた電子書籍「エキスバンドブック」に仕上げた。先述の実証実験では、一冊ニー三万円で画像データ化するシステムを開発するというが、三〇万円あればテキストーデータにすることができた。さらに村瀬氏は、根本的なところでも実証実験について疑問を感じていた。実験の発案者たちは、一方ではマンガなどのマスセールを念頭に置き、他方では復刊してもわずかしか売れない絶版本をデジタル化したいと考えている。結果的にそうした幅広い対象の電子本をあつかうというならわかるが、最初から方向性がばらばらで計画を立ち上げてもとうていうまくいくとは思えなかった。

[参考]
デジタルカタログサンプル