Googleのガイドラインに最近よく出てくる「質の高いコンテンツ」とか「低品質のコンテンツ」という言葉が出てきますが、これはいったい何を指して質が高いとか低いと言っているのでしょうか?
人間が見た場合の「質の高いコンテンツ」とは、
photo credit: Kalexanderson via photopin cc
- 他には無いオリジナルの情報が掲載されている。
- 特定の専門分野に対して深い知見がある。
- 「笑い」「感動」などを引き起こす共感性のあるコンテンツ。
などでしょうか。
これは、人間が文章を読んで理解し初めて分かるものですよね?もしかしてGoogleって、文章全部読んで、理解したうえで質を判断してるの?←だとしたらスゴい@@/
Googleがどこまで、文章の内容を理解しているかはブラックボックスですが、現在の文脈解析や言語処理の技術は「ほぼ理解できていない」というレベルらしいです。
Googleは、文章を単語ごとに区切りその単語ごとの意味を理解しているだけです。文章全体の流れを把握したりすることは、まだできていないそうです。
Googleもセマンティック・ウェブ技術を使ってユーザーが検索に求める「意味」を理解しようとがんばっていますが、検索結果の中に「こんなサイトがなんで1ページ目にあるの?」という事はまだしばしば見られる光景ですね。
また言語ごとにアルゴリズムの実装レベルに差があり、コアテクはもちろん英語。その後、主要各国の言語に落としていくっぽい流れがありますよね。日本語を含めた2バイト言語は、後回し(難しい?)らしくパンダアップデートが、本国導入から1年半後に日本語に適用されたのも、その流れが良く分かりますね。
Googleはどこまで内容を理解している?
こんにちは「実験くん」ですw。このシリーズは、SEOで語られる都市伝説やGoogleのガイドラインやアナウンスを実際に実験、検証してみるというコーナー。今回はその第一回目です!
今回のお題は「Googleはどこまで文章の内容を理解しているの?」というもの検証してみました。Googleが認める質の高いコンテンツは「文章(ページ内容のテーマ)に一貫性が無いとダメ」と言われたことがあります。これはよく言われる「ページのテーマはひとつだけ(=1ページ1キーワード)」とか「起承転結」とかでしょうか。
「Googleはこれを理解している?」。。。本当なのでしょうか?
今回、実験くんは、以前書いた投稿記事「話題の#グラドル自画撮り部」と「#グラドル地鶏部」wwwって?」の「テーマ(内容)を、わざとページの上下で2分割」し、Googleがテーマが2つに分かれているかを理解しているか?を実験してみました。
- 投稿記事の検証要素
- タイトル:話題の「#グラドル自画撮り部」と「#グラドル地鶏部」wって?
- ページ冒頭から750文字までは「グラドル」がテーマ。
- ページの後半1,250文字は家入さんの都知事選の話。
このエントリーを人間が読むと「グラドルの話と家入さんの話の2つをテーマに書いている」と理解できますが、Googleのウェブマスターツールの検索クエリをみてみると。。。。
※下記一覧は、ウェブマスターツールの検索クエリ(表示回数の大きいもの順)で上から並べてあります。
グラドル自画撮り部 |
自画撮り |
グラドル |
自画撮り部 |
#グラドル自画撮り部 |
グラドル地鶏部 |
グラドル自画撮り |
#グラドル地鶏部 |
グラビア自画撮り部 |
#グラドル自画撮り部 |
地鶏部 |
グラドル自画 |
倉持由香 |
自我撮り |
自画撮 |
#グラビア自画撮り部 |
倉持由香 自撮り |
自画撮り セクシー |
倉持由香 自画撮り |
自画 |
自画録り |
自画撮り女子 |
話題のグラドル |
グラドル自画撮 |
♯グラドル自画撮り部 |
グラドル 自画撮り |
自画撮り グラドル |
アイドル自画撮り部 |
自画撮り投稿 |
ツイッター 自画撮り |
twitter 自画撮り |
グラビア 自画撮り |
グラドル地鶏 |
自画撮り 投稿 |
グラドル 自画 |
自画撮りアイドル |
自画撮り 女子 |
倉持由香 過激 |
グラドル 自画撮り部 |
倉持由香 画像 過激 |
自画投稿 |
ツイッター 自画撮り |
地鶏 |
自画撮り twitter |
過激グラドル |
倉持由香 wiki |
自我取り |
yukakuramoti |
倉持由香 画像 |
自画撮り 投稿 |
グラドル自画撮り部 |
自画どり |
自画撮り 掲示板 |
過激 グラドル |
自画撮影 |
最近のグラドル |
twitter自画撮り |
セクシー自画撮り |
自画撮り ツイッター |
自画撮り画像 |
2ch 自画撮り |
家撮り |
自画撮りグラドル |
グラドル 過激 |
倉持 自画撮り |
グラドルじがどり |
自画撮り |
自画録り女子 |
グラビア自画撮り |
自画撮り アイドル |
自我撮 |
自画撮り 掲示板 |
投稿 自画撮り |
地鶏動画 |
過激なグラドル |
自画撮り 女子 |
自画撮りブログ |
グラドル |
グラドル 自画撮り部 |
自画撮り twitter |
twitter 地鶏 |
自画撮り グラビア |
自我撮り部 |
自画撮り写真 |
グラドル自画撮部 |
地撮り |
グラドル 倉持 |
馬 セクシー |
グラドル 自画 撮り 部 |
#グラドル自画撮り |
グラドル自我撮り部 |
自画取り |
グラドル自画取り部 |
自画撮り画像掲示板 |
家入一真 都知事 |
セクシーグラドル |
グラドル じがどり |
グラドル 自画撮り |
自画撮り ブログ |
自画撮り ブログ |
グラドルじどり |
倉持 グラドル |
#グラビア自画撮り部 |
自写撮り |
自画撮る |
twitter 自画撮り |
フォロバ 意味 twitter |
過激 グラドル |
ツイキャス |
グラドル 人気 |
自我どり |
twitter 自画 |
自分撮り セクシー |
グラドル人気 |
zigadori |
グラドル ブログ |
家入 ポスター |
マスメディア |
グラドル セクシー |
スマホ 自画撮り |
自我撮影 |
人気セクシーアイドル |
馬 セクシー |
自己撮り |
自画取り部 |
みなさんグラドルを検索するだけでこんなにいろいろなバリエーションで検索しているんですね。その数100バリエーション越え!恐るべしロングテール。。。
で、その100以上の検索種のほぼすべてがグラドル系。。。。。家入さんに関するキーワードは、下のほうに2つだけ。あとの100クエリ以上は「グラドル」に占領されています。Googleさんも、おスキね~(///^^///)。。←違うだろw!
この検索クエリの出し方だけを見る限り、Googleはこのページを「グラドル自画撮り部とグラドル地鶏部」がテーマだ!と認識しているとしか思えません。「家入さん」はGoogleにまったく無視されている状態ですねw。
【推測その1】このような結果がなぜ起きるているのでしょうか?キーワード密度?
まず最初に、昔よく語られてた、そのページに特定のキーワードの割合が多いほうがいいんじゃないか?という事が頭をよぎりました。Googleは「キーワード密度」で表示させる検索クエリを決めてるんじゃないのか?これを調べてみました。
No | 語意 | 回数 |
1 | 家入 | 15 |
2 | グラドル | 12 |
3 | 11 | |
4 | 選挙 | 11 |
5 | フォロワー | 11 |
6 | 自画撮り | 9 |
7 | 地鶏 | 6 |
8 | 出馬 | 6 |
9 | アイドル | 6 |
10 | 都知事選 | 6 |
11 | ポスター | 6 |
12 | ハッシュタグ | 2 |
13 | SNS | 2 |
「グラドル」より「家入」のほうがキーワード出現回数が多いですね。これじゃなかったみたい。。。
【推測その2】Googleは、ページの冒頭から数百文字しか見ていないかも@@?
「キーワード密度」でなければ、あと推測できることは「Googleは文章の前半(または最初から数百文字)だけ」から検索クエリに表示するものを選んでいるとしか思えません。。。。。
Googleは「質の高いコンテンツ」うんぬん。。とか難しいこと言ってますが、実はかなりシンプルに判定しちゃってるのかもしれませんねwww。という事は「冒頭の数百文字だけ一球入魂」で、あとは(文章の後半)水増し。。。。これでGoogleからの評価はバッチリOK!なんて抜け道も。。。。。ゴニョゴゴニョ ^^;
まとめ
この検証結果を、みなさんどう思われますか?
もちろん順位は、上記テーマ性の判定だけでなく「重複コンテンツ」や「外部リンク」など他の要素を含め総合的に判断しているので「冒頭から数百文字が重要」とは一概には言えないと思いますが、冒頭からの数百文字を意識してライティングするのは損ではなさそうですね。
避けたいのは、冒頭から数百文字にテーマとまったく関係ない「あいさつ」などを書いてしまった場合「あいさつ関連」の検索クエリが多くなってしまうことが考えられます。本来検索クエリに表示させたいテーマの表示が少なくなってしまう可能性が高いかもしれません。
最終的には、Googleよりも「人間が読んでどう思うか?」が本質なので、文章の流れぐらい自由に構成したいものですが「見つけてもらわないと読んでもらえない」というもの本質なので、Googleを使って認知を高めようとしたら、ある程度型にはまってしまうのも仕方ないかもしれません。
PS.この実験でちょっと検証していないのが「タイトルタグと本文のマッチング」です。
- 現行タイトル「グラドル」+本文前半「グラドル」+後半「家入さん」ですが、
- これをタイトル「家入さん」+本文前半「グラドル」+後半「家入さん」にした場合、
Googleは、どんな検索クエリで表示するのでしょうか?また今度試してみようと思ってます。
以上「実験くんが行く!」でした!第2段をお楽しみに~^^ ←第2段あるのかw?