検索対象は記事ページのみです

公開日 2021年12月07日

更新日 2021年12月08日

beトクシマで検索の対象としているページは、お知らせやイベントのページのみで、それ以外の団体の紹介ページなどは検索対象から外しています。
これにより最新の情報のみを効率的に探せます。

この検索システム(Joruri Search)では、お知らせやイベントのページを記事ページ、団体の紹介ページなどは固定ページと呼んでいます。
記事ページは記事一覧のページにページタイトルが羅列され、ページタイトルから記事ページにリンクが設定されています。
それに対して固定ページはそのような一覧ページがありません。

Joruri Searchでは、周期的に記事一覧を取得し、その差を比較することにより、新しく追加されたページや削除されたページを検出しています。
その結果を元に、新しいページの内容を取得しインデックスに追加したり、削除されたページをインデックスから削除しています。

記事ページの中でも、ヘッダー、フッター、左右のサイドバーは検索対象から外しています。
記事の内容のみを検索することとし、余計な文字がヒットしないようにしています。

Googleではこのような検索対象の絞り込みは行わず、すべてのページを検索し、関連度が低いページは検索結果一覧の後ろの方に表示しています。
Googleは検索結果一覧の並びを多くのルールで制御しているため、このような方法となっています。

それに対して、Joruri Searchでは汎用的な検索システムであるElastic Searchを利用していることや、検索対象のサイト数が非常に少ないことから、検索結果一覧を細かく制御するのは容易ではありません。
このため検索対象を最初から絞り込むことにより、検索結果一覧が適切な順番になるように工夫しています。

 

Topへ