4 音声入力システムによる文字データの作成手法
その他のデータ作成手法として,音声入力システムによるデータを作成する方法がある。現在の技術水準としては,ある程度の音声認識パターンを学習させることにより,音声を文字(テキスト)データとして変換できる手法・技術が確立されつつある。
但し,この手法や技術は,紙媒体のデータをいったん読み上げ,音声データに加工する作業自体を省力できないという制約がある。既に録音済みの音声データを活用する場合は別として,音声入力システムを活用して防災関係資料をデジタル化する場合,このような課題をクリアする必要がある。
3.2 電子媒体データの活用手法
既存の電子媒体を活用する方法は,画像データの加工・編集,文書変換(コンバータ)ソフトの活用,インターネットの活用及びPDF(統合環境で作成可能なデータ作成ソフト)の活用等に区分される。
OCRや画像処理ソフトを活用して作成した画像データやワープロ化文書等の電子媒体は,基本的に既にデジタル化されたデータである。
近年の都道府県・市町村・消防機関等の地方公共団体の防災関係資料の作成状況の推移をみると,ワープロやパソコン等によるデータ作成環境が引き続き拡大していくとみられることから,特に,ワープロ化文書のような日常利用においても既に定着した電子媒体による文書は,今後益々増えていくと考えられる。したがって,全体としてデジタル化された防災関係資料が今後益々増えるであろう。
しかしながら,後述するように,文書作成ソフトは多くの種類があり,これらの文書間には必ずしも互換性がないという現実がある。そのため,これらのデータの活用にあたっては,どの程度これまでの既存のデジタル化資産を有効活用できるか,具体的には,異種機器や異種メーカ間のワープロ化文書がどの程度変換できるかが問題となる。したがって,これらの課題を将来にわたってどの程度クリアできるか検討しておく必要がある。
こうした中で,インターネットを通じて取得できる資料は基本的にそのま使用できるデジタル化資料である。また,最近,PDF(統合環境で作成可能なデータ作成ソフト)をの活用することにより,データが作成された際のレイアウト等までも忠実に再現し,利用できる統合環境型のデータ作成ソフトが定着しつつある。
以下では,既存の電子媒体を活用する場合,データ処理過程に応じて活用されるデジタル化の典型的な流れとその事例を示す。