6.3 検索手法
(1) 検索エンジンの概要
インターネットなどで使われている検索エンジンは、その膨大な情報量に対応するために色々な技術が取り入れられている。
パソコンでの検索と言えば、AND検索、OR検索、NOT検索、グループ検索、フレーズ検索、正規表現検索などが一般的であるが、今回採用したPDFinderは((株)言語工学研究所が開発)PDFファイル文書の全文検索システムで、このエンジンはAND(単語の両方を含む文章検索)、とOR(いずれか一つの言葉を含む)この二つの検索式とそれに若干のオプションが付加されている。
これらの検索はCD-ROMに収められたPDFファイルからインデックスデータベースを構築してこれらに基づいて高速な検索結果を表示する仕組みになっている。
(2) 検索の方法
1] 通常の方法…データベース検索とPDFファイル検索
CD-ROMにはすでにインデックスデータベースが作成されているから、検索語を『検索文字列』枠に記入し(最大10件)、追加文字列検索枠の追加ボタンを押して検索語を入力する。この場合CD-ROM内に収録されている全てのファイルにアクセスして文字列を検索する。
上記は海技資格と調査研究という二つのワードで検索したイメージ画面である。
2] 1次検索のみによる検索
データベースのみを用い、PDFファイルにアクセスせず検索を高速に行う。
この際、PDFファイルにはアクセスせず、検索結果リストの一部の項目は「未確定」という内容が表示される。(コンテンツ、タイトル、サブタイトル等)。