goo攻略法徹底研究
PART1 gooとはどんな検索エンジンか
このシリーズの開始当初(2001年1月)、Yahoo! Japanはページ検索にgooのデータを使用していた。ご存知の通り、その後Yahoo!JapanはGoogleと提携、さらに現在では(2004年5月31日以降)独自エンジンを採用するに至っているが、本コラムではあくまで2001年1月時点での状況が前提となっていることを予めお断りしておく。また、フレームを使った検索エンジン対策を試みているが、これは現在ではスパムとみなされる行為である。しかし、結果、失敗に終わっており、反面教師の意味も込めて、このコラムの公開を続けることをご理解いただきたい。
gooはYahoo!と連携していた
gooの最大の特徴はなんといっても、Yahoo!と連携していることだろう。ご存知ない方のために説明しておくと、つまりこういうことだ。
キーワードは何でもいいが、Yahoo!で検索すると、検索結果としてまずYahoo!登録サイトが表示される。次に、すべての登録サイトを表示させると最後に ページ検索の結果を表示
と出てくるので、これをクリックすると、 ページとの一致
という検索結果が表示される。そして、実はこれはgooの検索結果とまったく同じものなのだ。画面右上に Powered by goo
と出てくるので、「知ってるよ」という人も少なくないだろう。
目的のキーワードに適合するYahoo!登録サイトの数が多いときはそうでもないが、登録サイトの数が少なければ、このことは重要な意味を持ってくる。特に登録サイトがまったくない時などは、いきなりgooでの検索結果が表示されるので意味はかなり大きい。何しろ、gooで上位に表示されれば、Yahoo!に登録されていなくてもYahoo!経由での訪問が期待できるのだから。実際、当サイトは未だYahoo!に登録されていないが、アクセスログを見るとYahoo!からのビジターは少なくない。どんなキーワードでヒットしているのか不明だが、そう上位に表示されているとも思えない。それでもYahoo!からそこそこ来ているところを見ると、それだけYahoo!のPV(ページビュー)は桁違いということだろう。そのおこぼれにあずかれるという意味でも、ここは何としてもgooでの上位表示を実現したいところだ。
gooは純粋なロボット型の検索エンジンではない
ディレクトリ型検索エンジンの代表選手のように言われるYahoo!が実はgooと連携することで実質的にロボット型の機能も持っている一方で、ロボット型と言われる検索エンジンの多くも実はディレクトリ型のカテゴリを持っている。infoseekしかり、LYCOSしかり、Exciteしかり、フレッシュアイしかり、OCN Naviしかり。そうした中でgooはカテゴリを持たない純粋なロボット型と言われていたが、昨年10月5日から「ディレクトリサーチサービス」が開始された。これは、gooのヘルプによれば 人気キーワードランキングを基にしたディレクトリ構造をもつディレクトリサーチサービス
で カテゴリー別に分類されたホームページの厳選サイト集
というものらしい。結局、大手と呼ばれる検索エンジンはみな似たような方向を向いているということか。今や純粋なロボット型と言えるのはGoogleくらいだ。
それから、以前は通常の検索とは別に最新の更新情報を検索できる「もぎたてgoo」というパートがあったが、いつのまにかなくなっている。たぶん、ディレクトリサーチサービスの開始と同時期に廃止されたのだろう。現在は、そのかわり「最新の結果」という形で、通常の検索結果(一般の結果)といっしょに表示されるようになっている。
gooはロボット巡回が遅い
gooのURL登録に関するヘルプを見ると、 データ更新には、およそ2週間程度かかるため、実際にURLをお知らせいただいてから更新するまでには通常二週間から1ヶ月程度かかります。また、ネットワークの状況やプロバイダのサーバメンテナンス中などの原因により、ロボットがページの情報を読み込めないこともあり、URL登録をして頂いてから1ヶ月以上のお時間を頂く場合もあります
とある。この件については、検索エンジンについて取り上げている色んなサイトを見てみると、45日以上かかったというサイトもあれば、2〜3日というサイトもあってその評価はまちまち。実際のところどうなんだろう。
そのヒントになりそうなのが、検索結果のURLの末尾に表示されている日付だ。gooのFAQに 検索結果の日付は何を表すのですか?
という質問があって、その回答は gooのロボットがURLを巡回した時の、そのファイルの最終更新日を表しています。日付情報が得られない場合は、そのURLをデータベースにインデックス化した時の日付を採用しています
となっている。ということはつまり、任意のキーワードで検索してみて、最も新しい日付を見れば、それが直近の「データベースにインデックス化した時の日付」と考えられる可能性が高いので、そこから登録に要する最短日数が推測できるのではないか。
そこで、最近何かと話題の「マイライン」で検索してみたところ(2001/1/11時点)、上位100件中、最新の更新日は2000年12月1日だった。「マイライン」というテーマから考えて、実際にはそれ以降更新されているファイルがかなりあると思えるが、それが反映されていないということは、12月1日より後はロボットが巡回していないということだろう。年末年始休暇をはさんでいることを考慮しても、登録までに要する日数はやはり1カ月強くらいは最短でもかかると予想できる。よく考えると論理の飛躍がありそうな気がしないでもないが、ここはひとまず「gooはロボット巡回が遅い」と結論づけておこう。
そんなわけで、これから上位表示のための試みをいろいろと行っていくわけだが、結果を見るのに1カ月以上はかかりそうなので、このレポートも1回ごとのインターバルがかなり長くなりそうなことをあらかじめご承知願いたい。
gooはよくわからない検索エンジンである
ここまでは上位表示のためのテクニックとは直接関係のないことだが、そろそろgooのアルゴリズムというか癖みたいなものを探っていくことにしよう。
まず、順位のつけ方についてだが、再びgooのFAQから引用すると、 gooは検索結果をどうやってランクづけするのですか?
という質問に対して、 検索条件にマッチする各ドキュメント(ページ)にはスコアがつけられます。スコアは入力された検索ワードが各ドキュメントにどの程度含まれているか等の情報を参考に計算されています。このスコアの高い順に検索結果をランク付けしています。スコアの最高値は99%になります
と回答されている。
しかし、このスコアというのがよくわからない。試しに「ワイン」で検索し、1000件目まで表示させてみたところ、2位以下はすべて98%だった。一般にgooはinfoseekなどと比べるとこのスコアがやたらと高く、しかも上位と下位の差があまりないという傾向があるようだ。いったいどうやってスコアを算出しているのか、そして同じスコアのサイトをどうやって順位づけているのか、まったくわけがわからない。
と、それで終わってしまってはレポートにならないので先に進めると、とにかくFAQにもあるように、スコアの計算は「入力された検索ワードが各ドキュメントにどの程度含まれているか」がひとつの目安になっていることは間違いない。そこで、「ワイン」で検索した時の上位10件について、「ワイン」が登場する回数を数えてみた。
表示順位 | スコア | タイトル | 本文 | フォントサイズ | METAタグ | |
---|---|---|---|---|---|---|
description | keywords | |||||
1位 | 99% | 1 | 19 | すべて"3" | − | − |
2位 | 98% | 1 | 11 | すべて"3" | − | − |
3位 | 98% | 1 | 0 | − | − | − |
4位 | 98% | errorのため不明 | ||||
5位 | 98% | 1 | 9 | "6"×1、"2"×8 | − | − |
6位 | 98% | 1 | 3 | すべて"3" | − | − |
7位 | 98% | 1 | 3 | すべて"3" | 3 | 3 |
8位 | 98% | 1 | 4 | "3"×1、"2"×1、 " 1"×2 |
1 | 2 |
9位 | 98% | 0 | 2 | "7"×1(※)、 " 2"×1 |
− | − |
10位 | 98% | 1 | 8 | "4"×2、"3"×6 | − | − |
厳密な法則性はないが、ほぼ含まれる検索ワードの数(と扱いの大きさ)に比例する順位になっているようだ。ちなみに1000位のサイトは本文中に1回「ワイン」が登場するだけ。それでもスコアは98%だった。やはり何だかよくわからない。
gooとMETAタグの微妙な関係
先ほど調べた上位10サイトのうちのいくつかはMETAタグを使用していたが、そもそもgooはMETAタグを参照するのだろうか。
ここで、本サイトのトップページで採用しているMETAタグの内容を再掲しておこう。
<meta name="keywords" content="ドメイン取得,独自ドメイン,ホスティングサービス,レンタルサーバ,Web制作会社,WEB制作,ウェブ,ウェブコンテンツ,制作会社,ウェブ運用・管理,アクセス向上,検索エンジン登録,検索エンジン上位表示">
<meta name="description" content="Web制作会社によるウェブマスタ応援サイト. ドメイン取得,サーバ構築,ホスティングサービスの選択,ウェブコンテンツ制作,アクセス向上など,ウェブ運用ノウハウを公開.">
まず、確実なのは、少なくともdescriptionは検索結果に表示されるということ。三度FAQから引用するが、 検索結果に表示される概要文を変更したいのですが?
という質問があり、それに対する回答は METAタグのdescriptionで希望の概要文をご用意下さい。METAタグがある場合は、その内容を概要文として採用します
となっている。これは当サイトでも確認しているので間違いのないところだ。試しに「BRnet Web Paradise」で検索してみると、概要文には Web制作会社によるウェブマスタ応援サイト. ドメイン取得,サーバ構築,ホスティングサービスの選択,ウェブコンテンツ制作,アクセス向上など,ウェブ運用ノウハウを公開.
と、descriptionの内容が表示される。
問題はkeywordsのほうである。FAQを含め、gooのヘルプにはMETAタグのkeywordsに関する記述が一切ない。一方、検索エンジンについて取り上げているいくつかのサイトを見ると、単にMETAタグを有効としているところと、無効としているところと二通りあるが、descriptionは有効だがkeywordsは無効、としているところはない。しかし、どうも体験的に言って、descriptionだけ有効でkeywordsは無効のような気がするのだ。
これを検証するために、「独自ドメイン」「検索エンジン登録」という2つのキーワードそれぞれとトップページのタイトル「BRnet Web paradise」をからめて詳細サーチをかけてみた。この2つのキーワードはkeywordsでのみ採用されているもので、タイトル、本文、description、いずれにおいても同じ形では登場しない。
結果は予想どおり。「独自ドメイン」「検索エンジン登録」いずれの場合も当サイトのトップページは検索から漏れてしまった。やはり、METAタグのkeywordsは無視されるのではないか。
ついでにdescriptionで使われている単語はキーワードとして有効なのか、これについても検証してみた。descriptionでのみ使われていてタイトルや本文では同じ形では登場しない単語は5つで、検索結果は次の通りである。
- 「Web制作会社」+「BRnet Web paradise」→×
- 「ウェブマスタ応援サイト」+「BRnet Web paradise」→○
- 「サーバ構築」+「BRnet Web paradise」→○
- 「ウェブコンテンツ制作」+「BRnet Web paradise」→×
- 「ウェブ運用ノウハウ」+「BRnet Web paradise」→○
実はまったく引っかかってこないのではないかと予想していたのだが、そうでもないようだ。ただ、すべてが有効なわけでもない。またまた、論理が飛躍してしまうかもしれないが、以上よりgooにおけるMETAタグの認識のしかたは次のように推測できるだろう。
- descriptionは概要文として採用され、そこで使われている単語も検索ワードの対象になるがキーワードとしての重要度は低い。
- keywordsは無視されるか、もしくは実質的に無視と言っていいほど重要度は低い。
後者については、有効としているサイトもあるので、その辺も考慮した上での判断である。それにしても、infoseek対策用にあれだけ苦心して選び抜いたkeywordsがgoo(だけではないが)では無効というのは、「何だかなあ」という感じで徒労感がいっぱいである。そこでその対策を実行してみることにした。詳細は次回レポートすることにしよう。