日本財団 図書館


イ)音声認識
     音声認識技術が進んでいるアメリカでは、音声認識分野において、1996年に1,500万件に及ぶ音声認識製品やテキスト読上げ製品が市場に出回っていると言われている。日本でも、キーボードでの入力に替わって、音声で入力を行うことができるパソコンが普及しつつある。
     音声認識技術の実用化の課題としては、以下のものが挙げられる。
    ・不特定話者を対象とした対話を可能とする
    ・音声認識における耐雑音性の向上
    ・同音異義語の文脈による識別
     また、アメリカでは、パソコンや携帯情報端末を持たない人々を電話の利用によって市場に取り込むという意図から、音声認識をインターネットに取り込んでいく動きが活発である。
     例えば、VISAインターナショナルなどの企業の5社は、「V-Commerce」というプロジェクトで、電話とインターネットの技術の統合に必要な標準化を検討しており、実現すると利用者が電話から音声で指示をだすことにより、Webから情報を提供し、電子商取引が可能になる。
     また、モトローラ社でも、ユーザーが音声で話しかけることにより、Webページをたどるように様々な情報を引き出すことを可能にするためのシステムを構築している。このシステムは、従来のタッチトーン電話による応答システムよりも、はるかに少ない労力でシステムが構築できるため、規模の小さい企業でも音声サービスを提供できるようになるとされている。既に、Webのホームページ上で、天気予報や金融情報、旅行情報などのコンテンツを提供している。
     さらに、Web上での情報を取り出すだけでなく、音声の指示を受け取ったアプリケーションが、読み出されたページの中から該当する情報を抜き出し、音声で読み上げてユーザーに返すという試行も行われている。

     これまで一般にキーボードからの入力の効率化と視認性の向上という点で使いやすいとされているGUI(graphical user interface:アイコンなどを用いた視覚的操作環境)ベースのアプリケーションも、視覚障害者やマウスの操作が困難なユーザーにとっては、逆に使いづらいものとなっている。 そのため、音声認識を利用したシステムは、これを解決するシステムとして今後大きな効果が期待できる。特に、福祉分野においては、高齢者や障害者などの弱者に対して、様々な情報を提供していく上で一つの手段になり得る。
     なお、マイクロソフト社のアクセシビリティ向上技術であるMSAA(Microsoft ActiveA?tess ibility)は、アプリケーションが画面に表示する様々な情報を受け渡すのに利用できる製品である。障害者向けソフトを開発するベンダーは、MSAAを使うことで、スクリーン・リーダ(画面読み上げソフト)や音声入力装置などを従来より容易に開発することが可能となり、障害者向けのソフトと容易に連携できるようになるといわれている。Windows98は、このMSAAを実装している。

 

 

前ページ    目次へ    次ページ






日本財団図書館は、日本財団が運営しています。

  • 日本財団 THE NIPPON FOUNDATION