【実験くんが行く!】Googleはどこまで文章の内容を理解しているの?教えてえらい人!

  • Facebook
  • Twitter

 Googleのガイドラインに最近よく出てくる「質の高いコンテンツ」とか「低品質のコンテンツ」という言葉が出てきますが、これはいったい何を指して質が高いとか低いと言っているのでしょうか?

 人間が見た場合の「質の高いコンテンツ」とは、

photo credit: Kalexanderson via photopin cc

  • 他には無いオリジナルの情報が掲載されている。
  • 特定の専門分野に対して深い知見がある。
  • 「笑い」「感動」などを引き起こす共感性のあるコンテンツ。

などでしょうか。

 これは、人間が文章を読んで理解し初めて分かるものですよね?もしかしてGoogleって、文章全部読んで、理解したうえで質を判断してるの?←だとしたらスゴい@@/

 Googleがどこまで、文章の内容を理解しているかはブラックボックスですが、現在の文脈解析や言語処理の技術は「ほぼ理解できていない」というレベルらしいです。

 Googleは、文章を単語ごとに区切りその単語ごとの意味を理解しているだけです。文章全体の流れを把握したりすることは、まだできていないそうです。

 Googleもセマンティック・ウェブ技術を使ってユーザーが検索に求める「意味」を理解しようとがんばっていますが、検索結果の中に「こんなサイトがなんで1ページ目にあるの?」という事はまだしばしば見られる光景ですね。

 また言語ごとにアルゴリズムの実装レベルに差があり、コアテクはもちろん英語。その後、主要各国の言語に落としていくっぽい流れがありますよね。日本語を含めた2バイト言語は、後回し(難しい?)らしくパンダアップデートが、本国導入から1年半後に日本語に適用されたのも、その流れが良く分かりますね。

 

Googleはどこまで内容を理解している?

 こんにちは「実験くん」ですw。このシリーズは、SEOで語られる都市伝説やGoogleのガイドラインやアナウンスを実際に実験、検証してみるというコーナー。今回はその第一回目です!

 今回のお題は「Googleはどこまで文章の内容を理解しているの?」というもの検証してみました。Googleが認める質の高いコンテンツは「文章(ページ内容のテーマ)に一貫性が無いとダメ」と言われたことがあります。これはよく言われる「ページのテーマはひとつだけ(=1ページ1キーワード)」とか「起承転結」とかでしょうか。

 

 「Googleはこれを理解している?」。。。本当なのでしょうか?

 

 今回、実験くんは、以前書いた投稿記事「話題の#グラドル自画撮り部」と「#グラドル地鶏部」wwwって?」「テーマ(内容)を、わざとページの上下で2分割」し、Googleがテーマが2つに分かれているかを理解しているか?を実験してみました。

 

  • 投稿記事の検証要素
    • タイトル:話題の「#グラドル自画撮り部」と「#グラドル地鶏部」wって?
    • ページ冒頭から750文字までは「グラドル」がテーマ。
    • ページの後半1,250文字は家入さんの都知事選の話。

 このエントリーを人間が読むと「グラドルの話と家入さんの話の2つをテーマに書いている」と理解できますが、Googleのウェブマスターツールの検索クエリをみてみると。。。。

※下記一覧は、ウェブマスターツールの検索クエリ(表示回数の大きいもの順)で上から並べてあります。 

 

グラドル自画撮り部
自画撮り
グラドル
自画撮り部
#グラドル自画撮り部
グラドル地鶏部
グラドル自画撮り
#グラドル地鶏部
グラビア自画撮り部
#グラドル自画撮り部
地鶏部
グラドル自画
倉持由香
自我撮り
自画撮
#グラビア自画撮り部
倉持由香 自撮り
自画撮り セクシー
倉持由香 自画撮り
自画
自画録り
自画撮り女子
話題のグラドル
グラドル自画撮
♯グラドル自画撮り部
グラドル 自画撮り
自画撮り グラドル
アイドル自画撮り部
自画撮り投稿
ツイッター 自画撮り
twitter 自画撮り
グラビア 自画撮り
グラドル地鶏
自画撮り 投稿
グラドル 自画
自画撮りアイドル
自画撮り 女子
倉持由香 過激
グラドル 自画撮り部
倉持由香 画像 過激
自画投稿
ツイッター 自画撮り
地鶏
自画撮り twitter
過激グラドル
倉持由香 wiki
自我取り
yukakuramoti
倉持由香 画像
自画撮り 投稿
グラドル自画撮り部
自画どり
自画撮り 掲示板
過激 グラドル
自画撮影
最近のグラドル
twitter自画撮り
セクシー自画撮り
自画撮り ツイッター
自画撮り画像
2ch 自画撮り
家撮り
自画撮りグラドル
グラドル 過激
倉持 自画撮り
グラドルじがどり
自画撮り 
自画録り女子
グラビア自画撮り
自画撮り アイドル
自我撮
自画撮り 掲示板
投稿 自画撮り
地鶏動画
過激なグラドル
自画撮り 女子
自画撮りブログ
グラドル
グラドル 自画撮り部
自画撮り twitter
twitter 地鶏
自画撮り グラビア
自我撮り部
自画撮り写真
グラドル自画撮部
地撮り
グラドル 倉持
馬 セクシー
グラドル 自画 撮り 部
#グラドル自画撮り
グラドル自我撮り部
自画取り
グラドル自画取り部
自画撮り画像掲示板
家入一真 都知事
セクシーグラドル
グラドル じがどり
グラドル 自画撮り
自画撮り ブログ
自画撮り ブログ
グラドルじどり
倉持 グラドル
#グラビア自画撮り部
自写撮り
自画撮る
twitter 自画撮り
フォロバ 意味 twitter
過激 グラドル
ツイキャス
グラドル 人気
自我どり
twitter 自画
自分撮り セクシー
グラドル人気
zigadori
グラドル ブログ
家入 ポスター
マスメディア
グラドル セクシー
スマホ 自画撮り
自我撮影
人気セクシーアイドル
馬 セクシー
自己撮り
自画取り部

 

 みなさんグラドルを検索するだけでこんなにいろいろなバリエーションで検索しているんですね。その数100バリエーション越え!恐るべしロングテール。。。

 で、その100以上の検索種のほぼすべてがグラドル系。。。。。家入さんに関するキーワードは、下のほうに2つだけ。あとの100クエリ以上は「グラドル」に占領されています。Googleさんも、おスキね~(///^^///)。。←違うだろw!

 この検索クエリの出し方だけを見る限り、Googleはこのページを「グラドル自画撮り部とグラドル地鶏部」がテーマだ!と認識しているとしか思えません。「家入さん」はGoogleにまったく無視されている状態ですねw。

 

【推測その1】このような結果がなぜ起きるているのでしょうか?キーワード密度?

 まず最初に、昔よく語られてた、そのページに特定のキーワードの割合が多いほうがいいんじゃないか?という事が頭をよぎりました。Googleは「キーワード密度」で表示させる検索クエリを決めてるんじゃないのか?これを調べてみました。

No 語意 回数
1 家入 15
2 グラドル 12
3 Twitter 11
4 選挙 11
5 フォロワー 11
6 自画撮り 9
7 地鶏 6
8 出馬 6
9 アイドル 6
10 都知事選 6
11 ポスター 6
12 ハッシュタグ 2
13 SNS 2

 

「グラドル」より「家入」のほうがキーワード出現回数が多いですね。これじゃなかったみたい。。。

 

【推測その2】Googleは、ページの冒頭から数百文字しか見ていないかも@@?

 「キーワード密度」でなければ、あと推測できることは「Googleは文章の前半(または最初から数百文字)だけ」から検索クエリに表示するものを選んでいるとしか思えません。。。。。

 Googleは「質の高いコンテンツ」うんぬん。。とか難しいこと言ってますが、実はかなりシンプルに判定しちゃってるのかもしれませんねwww。という事は「冒頭の数百文字だけ一球入魂」で、あとは(文章の後半)水増し。。。。これでGoogleからの評価はバッチリOK!なんて抜け道も。。。。。ゴニョゴゴニョ ^^;

 

まとめ

 この検証結果を、みなさんどう思われますか?

 もちろん順位は、上記テーマ性の判定だけでなく「重複コンテンツ」や「外部リンク」など他の要素を含め総合的に判断しているので「冒頭から数百文字が重要」とは一概には言えないと思いますが、冒頭からの数百文字を意識してライティングするのは損ではなさそうですね。

 避けたいのは、冒頭から数百文字にテーマとまったく関係ない「あいさつ」などを書いてしまった場合「あいさつ関連」の検索クエリが多くなってしまうことが考えられます。本来検索クエリに表示させたいテーマの表示が少なくなってしまう可能性が高いかもしれません。

 最終的には、Googleよりも「人間が読んでどう思うか?」が本質なので、文章の流れぐらい自由に構成したいものですが「見つけてもらわないと読んでもらえない」というもの本質なので、Googleを使って認知を高めようとしたら、ある程度型にはまってしまうのも仕方ないかもしれません。

 

 

PS.この実験でちょっと検証していないのが「タイトルタグと本文のマッチング」です。

  • 現行タイトル「グラドル」+本文前半「グラドル」+後半「家入さん」ですが、
  • これをタイトル「家入さん」+本文前半「グラドル」+後半「家入さん」にした場合、

Googleは、どんな検索クエリで表示するのでしょうか?また今度試してみようと思ってます。

 

以上「実験くんが行く!」でした!第2段をお楽しみに~^^ ←第2段あるのかw?

 

ひとことで結構です。ぜひ感想をお願いします!
「面白かった~」の一言がすごく励みになるのです(^o^)/

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

TOPへ戻る