検索についてのちょっとした疑問、もれなく検索するためのテクニックなどをご紹介します。

検索をしてもヒットしない、ヒット件数が少ないのはなぜ?(新聞記事編)

「表記ゆれ」を意識していますか?

「ペット」か「PET」か

新聞記事では、同じ概念を表す複数の言葉(表記)がある場合、どれを選択するかがある程度ルール化されています。例えば、農作物の名前などは、一般に「リンゴ」「サトイモ」のようにカタカナで記述されています。

では、ペットボトルのリサイクルについて調べたい場合、どんなキーワードで検索をすれば良いでしょうか。


「毎日新聞記事情報」「日刊工業新聞・流通サービス新聞記事情報」でそれぞれ以下の2種類の表記で文字列検索をすると、ヒット件数は以下の通りでした。

各新聞の性格によってデフォルトの表記が違う場合があります。専門紙・一般紙で横断検索をする際には、他の表記がないか、気をつけてみてください。


この場合、もれなく記事を集めるためには、下図のようにキーワード同士を「OR」でつないで検索をします。

時代と共に変わる表記

インターネットの接続サービスを提供する業種は何と表現されることが多いのか、「日刊工業新聞・流通サービス新聞記事情報」を使って、思いつく言葉で文字列検索をしてみました。

(4) の「インターネット接続サービス」は、上記4つの言葉のヒット件数の合計のうち、全期間対象では66%を占めていましたが、2001年以降の記事では80%を占めています。

また、右の表は「日本農業新聞」で検索をした結果です。

1996年以降、「ゴーヤ(ー)」という呼び方が一般化してきたことが読み取れます。

このように、特に比較的新しい言葉の場合などは、時間と共に呼称が変化したり、或いは統一されていったりすることがあります。また、時間が経過するほど省略されて短くなったり、中黒「・」などが除かれたりする傾向があります。古い時代の記事を探すときなどは、少し注意をしてみてください。

新聞記事データベースを効率良く検索する上で、実際に新聞記事中で使われている言葉の傾向を知ることが大事です。普段新聞を読む際に、興味のある分野のキーワードがどんな表記をされているかを意識して読むとよいでしょう。

(G-SearchPRESS No.4 掲載記事より)
※掲載にあたり、一部加筆・修正しています。

ページの先頭へ