こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

ウィキペディアの検索優位性

グーグルやヤフーなどで何かキーワード検索すると、ウィキペディアが上位にヒットします。何故ですか?

勝手な推測ですが、検索エンジンとウィキペディアの癒着を感じます。これであるサイトの順位が1つ下がって、損害を受ける被害者がいるのでは?ウィキペディアの検索優位性は、市場原理に基づいた正当なものでしょうか?卑怯な方法や違法行為で、強制的に順位を引き上げてる気がします。別の言い方をすると、グーグルと何か契約結ぶなりすれば、あるサイトのランクアップ、欲を言えば首位まで引き上げられるのでしょうか?

ヤフーなら、ウィキペディアよりヤフー百科事典を上位に載せた方が良いはずです。記者はプロだし、スポンサーサイトの広告にもなるし、ヤフー利用者を信頼ある情報に導いたのです。そうすると、ヤフーは良い検索エンジンだといった評判が高くなり、支持が厚くなります。しかしそれでも、何故かウィキペディアが上位です。何を上位にランクさせるかは、ヤフーが勝手に決めて良いですよね?

ウィキペディアの執筆者は匿名のボランティアです。プロの学者が書いている場合もありますが、子どもや素人の場合もあります。別にこれはこれで表現の自由ですが、もっとオフィシャルでクオリティー高くて有益なサイトは幾らでもあるのでは?こういったサイトを上位に載せるべきでは?

検索エンジンのヒットランキングルールに疎いので質問しているのですが、ウィキペディアの記事のコピーを一般人の個人ホームページに載せても、ランキングはかなり下だと思います。内容は同じなのに、ウィキペディアと個人ホームページのランキング順位の差は何でしょう?検索エンジンとウィキペディアは「上位ヒット契約」を交わしてるから、同じ内容なのに順位に大差が出るのでは?それとも、関連記事へのリンクが充実してるから、順位が上がっているんでしょうか?

投稿日時 - 2012-05-05 18:43:56

QNo.7459435

暇なときに回答ください

質問者が選んだベストアンサー

GoogleなどでWikipediaの記事が上位表示されるのは、恐らくdomain authority(ドメインの格付け・権威)が原因だと思います。これは、検索エンジンがドメイン(この場合、wikipedia.org)に対して与える評価点の様なものです。domain authorityが何によって決められているのか公開されていないと思いますが、ドメインの古さとか、リンクの数とか、閲覧者数や閲覧状況などで決まるようになっているのでしょう。

実際にはWikipediaは、ただの掲示板と何も実質的な差はないので、同じ内容なのにWikipediaの記事が検索で上位に表示され、個人のホームページだと下位に表示されるというのはおかしな話で、全く不公平だと思います。但し、それは検索エンジンのアルゴリズムが未熟なためであり、癒着ではないでしょう。

とはいえ、Wikipediaの記事が上位表示されるために、それを悪用する人が跡を絶たたず、かなり公害をまき散らしているようです。Wikipediaの様な百科事典や辞書のたぐいは、トップページを残して、検索結果から全部のページを排除した方がいいでしょう。こういう状況を是正するには、まずは、私たちがWikipediaの全ページ上位表示はおかしいという認識を持つことが大切だと思います。

投稿日時 - 2012-05-19 02:16:33

お礼

さんきゅー

投稿日時 - 2012-05-19 18:11:51

ANo.4

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

-広告-
-広告-

回答(5)

ANo.5

参考になるページを見つけたので、No.4の補足として、それに基づいて書いておきます。なお、このページは間違ったこともかなり書いているので、ご注意ください。そもそも内容が5年も前の話になり、検索エンジンのアルゴリズムも現在とは大幅に違います。そういった点を修正し、足りない点を追加して、以下に書き直しておきます。

1.大量のページ数
検索エンジンはページ数の多いサイトのページを上位表示する傾向が非常に強いです。Wikipediaは記事数ベースで、現時点で1140万ページ(うち日本語のページが81万ページ)もあります。個人的経験の範囲内での話ですが、個人のホームページでは10ページから数十ページが程度が多く、ブログでも最大で5千ページ前後ぐらいまでが普通ですから、全く太刀打ちできません。ページ数を独立した指標にしているのかどうかは不明ですが、結果的にはそうなっています。ページ数が多ければ、内部リンクの数が増えますから、間接的に寄与しているかもしれません。

2.大量の内部リンク数
Wikipediaは、網の目に様にドメイン内部でリンクが張り巡らされています。個人のホームページでは、内部リンクが少ない傾向にあるので、ここでも差がつきます。しかも、同じ用語が何度も同一ページに現れる場合、全部の出現場所からリンクを貼らず、一つだけからリンクを貼っているので、スパム行為になりません。つまり、過剰なリンク数で検索エンジンに減点されません。

3.関連性の高いページからのリンクの数が多い
内部リンクもそうですが、外部リンクもその傾向が高いです。個人のホームページでは、相互リンクが多いため、関連性のあるページからのリンクとは限らず、関連性のないページからのリンクの割合がかなり高いと思います。

4.良質なコンテンツが多い
必ずしも最高のコンテンツとは限りませんが、一般の閲覧者には良質であるに違いないと認識されているので、じっくり読んでもらいやすく、閲覧者数や閲覧状況で優位に立っています。検索エンジンが人間の目でチェックを入れてきても問題になることはまずありません。

5.大量の外部リンク数
正確な外部リンク数はわかりませんが、ドメイン単位でも、Alexaの調べで219万ドメイン以上あるので、その10倍の2200万ドメイン以上は確実にあるでしょう。特に有名な人とか有名なサイトを除き、特別に自分で宣伝していない個人のホームページでは、普通、10ドメインもあればいい方でしょう。全くゼロか一つぐらいが圧倒的に多いと思います。検索順位では、これが最大の要素になると思われますので、全然太刀打ちできないことがはっきりわかります。不公平さについて言えば、Wikipediaの記事だと個人のホームページの記事よりも2200万倍良いかというと、そうとは言えない場合が少なくないところが不公平なわけですね。

6.HTMLがよい
個人のホームページの場合、HTMLがよくない場合が多いです。しかし、WikipediaのHTMLは単純できれいなので、有利です。但し、これは実際にはあまり検索結果に影響はないでしょう。それに、WikipediaのHTMLは、きれいですが、画一的です。個人のホームページだと、一般に各ページ特異なHTMLになっていますから、その点、ほんの少し有利です。個人のホームページの唯一有利な点ですが、他の指標での差を打ち消すほどの効果は全くありません。

7.ページごとにコンテンツが特化している点
検索エンジンで上位に表示されるには、1ページ、1テーマであると有利ですが、Wikipediaはそうなっています。

8.検索エンジンの利用者が探している情報に合致するコンテンツを持つ
検索エンジンを利用している人は、特定の情報を探している場合がほとんどです。Wikipediaのページは、そういう情報と合致する情報を提供している場合が多いので、閲覧状況がよく、検索エンジンから高い評価を受けやすいです。検索エンジンを利用した人がどのサイトのどのページを時間をよくかけて、じっくり読んでいるのか、検索エンジン側は大体把握しています。

9.PageRankが高い
Google及びGoogleを使っている検索エンジン(Yahoo!Japanなど)での話に限定されますが、wikipedia.orgは、GoogleのPageRankが高く、現在0~10の11段階で9になっています。PageRankと検索順位の相関はかつて0.7ぐらいあったという話もあります。今は、かつてほどの威力はないようですが、現在でも、PageRankはかなりの影響力があるものと思います。これはGoogleやYahoo!並のPageRank(ページランク)ですから、検索で優位になっても当然です。普通の個人のホームページのPageRankは「なし」か「0」ぐらいが圧倒的に多く、高くても「4」ぐらいです。「4」以上の個人のホームページやブログは、特別に有名なものに限定されます。4や5でも9には到底かないません。個別の記事でも同じ傾向で、たとえば、「織田信長」で検索すると、Wikipediaの記事のPageRankは「5」です。一方、個人の独自ドメインのホームページと思われるsengokujidai.netの「織田信長」はPageRank「3」です。また、個人の無料ホームページのgozaru.jpの「織田信長の館」は「1」にすぎません。

10.相互リンクがない
Wikipediaは相互リンクがないか、ほとんどありません。全部常に一方向だけのWikipediaへ向けた片側リンクです。Wikipediaからの発リンクはすべてnofollow属性で無効になっています。一方、個人のホームページは、相互リンクが多く、せっかく外部リンクがあっても、検索エンジン側で両方ともほとんど無効にされています。わかりやすく言うと、Wikipediaというサイトは、リンクの効果を他人からもらうだけで、誰にも与えていないわけです。スパム防止が目的ですが、リンクの貼り方としては不公平です。いずれにせよ、自分へ向けた片側リンクが多いサイトは、検索で上位表示されるため、Wikipediaの記事が上位表示されやすくなっています。



以上、細かく分析すると、こうなるわけですが、なぜ同じ内容でもWikipediaでは検索結果で上位表示されるのかという話になると、結局の所、domain authorityの差ということになるのではないかと思います。不公平だと感じる人は、Wikipediaへのリンクは貼らないようにするのがいいと思います。

なお、さらに追加すると、癒着というのはないと思いますが、検索エンジン側で人の手が入って、Wikipediaが上位表示されるようになっている可能性は否定できません。根拠としては、確か、政府関係のサイトは、最初から上位表示されるように人の手が入っていたと思います。個人的な見解ですが、Wikipediaの検索順位に人の手が入っている可能性は半分ぐらいあるような気がします。

ついでに書いておくと、同様の検索結果上の不公平な現象は、Wikipedia以外でも、このような質問サイトやはてなキーワードなどでも現れています。困ったものですね。

参考URL:http://www.web-20.net/2007/01/wikipedia.html

投稿日時 - 2012-05-19 15:01:35

お礼

さんきゅー

投稿日時 - 2012-05-19 18:12:21

仮に癒着していたとして何の問題があるのかさっぱりわかりません。私企業がどの企業と癒着しようが検索結果を改ざん、捏造しようが法令に違反するのでない限り自由です。

投稿日時 - 2012-05-06 12:07:06

補足

癒着は私企業の自由ですが、民は癒着を嫌い淘汰するのが普通です。しかし、民はグーグルやウィキペディアをよく使います。民が自らの意思でこれを使っているのか、それとも、癒着でも上位サイトだから順位に騙されて使わされているのか、混乱したのです。上位サイトというよりは、自分が望むサイトに少ない労力と時間でアクセスしたかったのです。

投稿日時 - 2012-05-19 18:11:13

ANo.2

評価ルールはどこの検索サイトでも、独自の方針がありますから
正確に全部把握している人はそんなにいないと思いますが…
単純問題、Wikipediaは知名度が非常に高い。

そのため、そこにリンクされている他のサイトの数が非常に多いので
そのぶん評価が高くなっていたりします。

このWikipediaの人気が高い理由の一つには
非常に微に入り細に入り、いろんな項目が揃っていることがあります。


#こっから長くなりまつ

たとえば、インターネット利用者の大半はパソコンを使っていて
そのうちたぶん8割くらいは、リカバリーシステムを伴ったWindowsPCを使っています。

リカバリーディスクやリカバリー領域は、今や無くてはならない技術の一つです。


で、2005年夏、Wikipediaに私が作った"リカバリー領域"という項目は
数年の間に、数人によって修正と追記が繰り返されて、関係するいろんな情報を提供しています。
http://ja.wikipedia.org/wiki/%E3%83%AA%E3%82%AB%E3%83%90%E3%83%AA%E3%83%BC%E9%A0%98%E5%9F%9F


対してYahoo百科事典で、リカバリーで検索するとこんな感じです。
http://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%E3%83%AA%E3%82%AB%E3%83%90%E3%83%AA%E3%83%BC&dtype=0&dname=0na&stype=0&pagenum=1&index=21285700

すでに、リカバリーCDなんか付属していないPCがあたりまえの時代
付いていたとしても、とっくにリカバリーDVDの時代。にも関わらず…
リカバリー領域についての情報は一切ないのがYahoo百科事典です。

「探してもリカバリーCD無いから、このパソコンもう使えないんだ」

と絶望する人もいるんですけど、そういう人のための情報を整備する手段として
Wikipediaはとても便利なんです。目的によっては個人サイトで頑張るより効率的。
このサイトで、そういう質問があったら、WikipediaのURL示すだけでも済みますしね。


Wikipediaには、誤った記述や、悪意ある主張を修正できる余地がありますから
このサイトの、締め切られたら反論も修正もできないシステムに比べると、大幅に信頼性がありますよ。

思い出せないけど、このサイトで誤った回答で終了している質問を見て
Wikipediaの項目に、関連する情報を追記したことも何度かありますよ
それによって、後に同じ悩みを抱えた人は、より多くの情報を得られるんです。

でも、私が最近、大幅加筆した"ドライブレター"の項目みたいに
有用な情報が欠落した項目もあります。問題点ばかりあげつらった項目になっています。
これは、その有用な情報について、私は詳しくないから、書いていないからです。


Wikipediaを見て、項目に不備や誤り,偏りがあるなら
気づいた人がそれを修正していけばいいと考えています。


Webはマーケティングのためにあるわけでもありませんから
検索ヒットの順位が低いから損するという発想自体間違いです。

情報には中立性が求められるという事情もあります。
たとえば、個人がアフィリエイト広告を伴ったサイトを作っていれば
そこでは広告商品を、過剰に褒めることが横行するわけです。

広告が無いにしても、ステマが問題視されている時代です。
ですから、広告なんか無いサイトのほうが信頼される時代でもあるのです。


たとえば、「リカバリーCDが必要です」というアドバイスで、Yahoo百科事典を見たとします。
今私のPCにはLenovoの広告がリカバリーCD項目に表示されています。

「リカバリーCDなんか無いから、もうダメなんだ」と思ったら、
買い替えなきゃならないかなぁ…と思ってLenovoクリックしちゃいますよね。

でも、この5年に販売されたPCのほとんどは
リカバリーCD/DVD無しで、リカバリー領域搭載製品なんですよね。

これ、本当に消費者利益になっているのかなぁ?と、そう思います。


で、最後にちょっと専門的な分野の項目を三つだけ、Yahoo百科事典で見てみました。

Linuxとオープンソースの項目は、焚書レベルに誤りがあります。

Linusがオープンソースを始めたかのような記述があって、なんとRMSの項目自体が無い(爆)
デジタル家電のほとんどに関わり、その説明書にも記述されているGPLの項目も無い。
そもそもオープンソースの項目でライセンスについて一切触れていない。

OSの項目にも、普遍的ではない要素が書かれていながら、重要な役割の一部が欠落。
デバイスの抽象化も、権限の制限も説明せず、OSの説明に分散システムを記述しておいて
OSの例にPlan9が無いとか、分散システムをなんだと思ってんだと…もうね

署名記事でこのレベルだとちょっとおどろくほどがっかりです。

でも、これをYahooの指示や依頼無しに修正する手段は誰にも無いのです orz
これじゃ、検索ヒットの優先度が高くできるわけが無いと思います。

投稿日時 - 2012-05-05 23:42:43

お礼

さんきゅー

投稿日時 - 2012-05-06 10:26:55

ANo.1

>ウィキペディアが上位にヒットします。何故ですか?
Yahoo!にしろGoogleにしろ、検索ランキングアルゴリズムを公開していないので、第三者が知りえることはできません。

>卑怯な方法や違法行為で、強制的に順位を引き上げてる気がします。
ええと、何が「卑怯」で何が「違法」なんでしょうか?一私企業が不公平にランキングを付けて何か問題でも?それとも、新聞は公共のものだから無料で広告を掲載しろと仰るクチですか?

>グーグルと何か契約結ぶなりすれば、あるサイトのランクアップ、欲を言えば首位まで引き上げられるのでしょうか?
公開されている範囲では存在しません。

>何を上位にランクさせるかは、ヤフーが勝手に決めて良いですよね?
Yahoo!ならそうです。ただ、検索エンジンはGoogleと同じですけど。
http://pr.yahoo.co.jp/release/2010/0727a.html

>もっとオフィシャルでクオリティー高くて有益なサイトは幾らでもあるのでは?
何をもって「オフィシャル」とするかを今の検索エンジンでは判断できないのです。
ところで、「集合知」という言葉はご存知ですか?
http://ja.wikipedia.org/wiki/%E9%9B%86%E5%9B%A3%E7%9A%84%E7%9F%A5%E6%80%A7

投稿日時 - 2012-05-05 22:57:33

補足

グーグルの社長室に土足でウィキペディアの利用者が侵入して、ピストル向けて「ウィキペディアの記事がベストテンにランクするよう検索ルールを定めろ!さもなければ撃つぞ!」ってやれば違法でしょう。日本だと脅迫罪です。

グーグルの意思でウィキペディアを上位ランクさせてるのなら良いですが、ウィキペディアに脅されてるなら問題です。今のウィキペディア優位性がグーグルの意思なのか、疑わしいです。

集合知も集団的知性も架空の言葉です。造語です。

投稿日時 - 2012-05-06 10:25:46

-広告-
-広告-

あなたにオススメの質問

-広告-
-広告-