2.3 インデックス情報による文書情報の検索方法
大量のデータから検索する場合、インデックス情報を使うことにより、早く確実に検索が可能となる。ここでは文書情報の検索に向いている検索方法について説明する。
検索とは、広義の意味で文書の作成・入手段階から処理(決裁・回覧・配布)・保管・保存・廃棄までのライフサイクルの中で、文書情報や管理記録の抽出を統合的に行える仕組みであり、特に大量の文書情報・メタデータを正確で、かつ高速に検索するためにはデータベース・ソフトによる検索システムが必要となる。
2.3.1 キーワード検索
文書情報に固有な項目(文書名、管理番号、作成者、作成日など)をキーワードとして登録し、このメタデータをキーワード領域として指定して検索を実行する方法をいう。必要な情報をインデックス化するため、データ容量が比較的小さく、検索速度を高速化できる。また、「○○以上」、「○○以下」、「○○含む」、「○○含まない」などの検索条件の設定やAND・OR検索などの論理検索を組合せることも可能である。
2.3.2 ディレクトリ検索
あらかじめ分類・階層化されている情報を項目化(定数化)してデータベースに保存し、検索時にその分類項目を選択するだけで結果を抽出する方法。分類項目を選択するだけで検索できるため、分類項目を比較的簡単に検索することが可能である。
2.3.3 全文検索
入力されているコード情報すべてを検索する方法。キーワード検索・ディレクトリ検索は、あらかじめキーワード・コード等の検索項目を作成しておく必要があるが、全文検索ではすべてのデータが直接的に検索の対象となる。電子化文書(文書イメージ)の場合は、イメージ化と同時に全文を対象としたOCR処理を行い、全文検索用テキストファイルを事前に作成しておく必要がある。
2.3.4 自然語検索
キーワードではなくて、自然語を入力して検索する方法で、あいまい検索とも呼ばれる。入力した情報の類似情報、関連情報を検索してくることが可能。
2.3.5 シソーラス検索
同義語と思われる単語等を類推し、その該当情報を検索してくる方法。
前へ一覧へ次へ




