数多検索術の抜き出し。たいした事じゃないと思うのだけど、よりよい検索ライフを送るためにはこういった情報をアウトプットして、他の人から「俺こういうことしているよ!」ってフィードバック貰えたら高み(?)にいけるとおもうのです。
というわけで、以下にダラダラと書きだしました。
これくらいは普通な使い方だと思っている。
- 欲しい情報が上位にあるとは限らない。
- 情報を抽出するための、あらゆるキーワードを使う。
- ただ羅列するのではなく、思い浮かんだ問題を助詞助動詞抜きにするとか。
- 「○で△を□するには?」→"○ △ □する"
- 最新の情報、トレンドな単語で抜き出したいのならブログor掲示板検索を使う。
- そういうのに敏感な人達は多いし、既にまとめてくれたりもする。
- アップデートは実況のような、同時並行時事に強いけど平時にはほとんど使えない。
- google.comで言語を英語にするとつぶやきを遡れるので、過去の発言を取り出すのには使える。
- もうちょっと慣れたら、"過去に流行ったもの"を抜き出すのに使える。
- 特に注目される分野であったり、共通視点が多いものはブログ・掲示板検索のほうが早い。
- 突っ込んだ内容であれば尚更。
とりあえず、知っておいて損はしない事。
たとえば、"Opera Google"で検索したとする。すると、こういう結果*1が得られる。
ちなみに、赤い数字とかはFirefoxのはてなブックマークの拡張によるものなので、気にしないでくださいね。
注目すべきは4つ。
- タイトル
- 当然。
- ただ、タイトルだけじゃなくてサイト名も把握した方がいい。ここでは隠れているけど。
- URL
- 最近GoogleはURLを階層ごとに分けて、しかも別の単語に置き換えちゃうからたちが悪い。
- とはいっても、そういうことをするのは有名サイトばかりなので、気にしなくてもいい。
- スニペット
- キーワードが含まれる文章が切り出されて、どういう意味内容にあるのかを端的に知ることができる。
- だけど、キーワードが多すぎるとスニペット中に...が複数出てくる。
- ...がある場合は、たとえスニペット全体にキーワードが含まれていても、...の前後にあるのなら全然関係ない文脈で語られている。
- 極端な例を挙げると、「これだから...Googleのはすごいけど...Operaは、まあ...使い物にならないし。」というスニペットはその結果のページにひとつの文章として掲載されていない。
- 的確な情報を抽出したいのなら複数のキーワードを使うべきだけど、自分が予想した文脈で抜き出せないのなら直ぐに組合せをかえたり減らしたりすること。
- 日付
- スニペットの前に日付があることがある。
- ちなみに、タイトル右に日付がつくことがあるけど、それはあなたが最後に訪問した日付なのでここでは関係ないです。
- スニペット前の日付は、そのページの情報の新旧を知る手立てになる。だけれども...。
- 左サイドバーにある"期間を指定"も同じなのだけど、この期間とはそのページがいついつwebに登場したか?ではなくて、Googleクローラがいついつ訪れたという意味。
- スニペットの前に日付があることがある。
この4つはそれぞれ個別に捉えるんじゃなくて、複合的に読み取らないといけない。
- タイトルとURL
- タイトルは欲しい情報を表しているけど、URLが怪しい。
- "○ △ □"で検索したら、"http://*.com/○+△+□.html"というページが出てくることもある。特にファイル検索とか。
- スニペットとURL
- URL(ドメイン部分)は変な羅列だし、スニペットも言語じゃない!となると、それは大概スパム。
- URLと日付
- 日付は最近なのにURLはそれ以前になっている場合がある。
- Googlebotがその時に来たんだ、と知ることができる。それだけ。
- スニペットとキャッシュ
- キャッシュは、重いサイトを見るとか削除されたページを見るとかだけでなく、いつそういう情報が乗ったのかを知るための手段でもある。
- よるあることは、欲しい情報が載っているのだけど開いたらそのページになかったと言うとき。
- これは、過去にそのページにあったのだけど更新されて過去ログになっちゃったから見られなくなった、そんな時に使える。
- トップページしかクロールしていないとか、そのサイトの検索結果をクロールした場合に頻発する。
*1:Google日本語入力とOperaの相性がわるいよ!っていう結果