2/04/2011

[law stat] 相撲の八百長統計分析論文

長年の八百長疑惑がついに確定という事で騒乱の最中にある大相撲ですが、取組結果のデータから八百長の存在を統計的に炙り出した2002年の米Chicago大Steven D. Levitt教授による論文が凄いと聞いて、軽く読んでみました。

肝心の回帰分析における変数とかの説明が端折られてて少し怪しい感じが漂いますが、経済畑の人の論文にはよくある事だし、面倒なので無視。この辺の変数等のモデル及び手法の正当性を信じるなら、グラフやら表には、8勝目の勝ち星に関する勝敗の偏りがはっきり表れている、ように見える構成になっています。モデルの構成や分析の手法自体はさほど高度なわけでもありませんが、逆に割とシンプルな感じな分、信憑性は高そうです。といっても、一般の人が読んで理解出来るわけではないでしょうけれども。

そしてそこから読み取れる傾向たるや、まさに絵に描いたようなという感じで。頻度分布の7勝と8勝部分の二項分布からのあからさまなズレ具合に始まり、勝たせてもらった相手には次の取り組みで負けて借りを返してるとか、特に後半戦での偏りっぷりとか、あまりに露骨で引きますね。メディアのガサ入れがあると一時的に偏りが消える所とかも、統計的には疑問も感じますが、とてもリアルです。

本件は既に広く報道もされていますから、本論文に基づいた追及やらが、多分にまともに理解出来てない人達から伝言ゲーム的にカオス感を強めつつ行われていくのでしょうけれども、追及を受ける当の相撲業界の人達はさらにこういった方面の素養が皆無で、理解の出来ない人達なのだから、始まる前からもう訳が分かない事態になるであろう事は必然、色々面白い反応、やり取りが見られそうです。当人達はまさか、どういうことなの、と色々と愕然としている事でしょう。完全に自業自得ですけれど。

公益法人認定の却下もちらつく中、内容も概ねまともそうに見え、またその出自から権威性も十分に備えた本論文は、おそらく行政の側も注目するであろうし、その持つ意味合いは小さくないでしょう。八百長は今回が初めて、以前は無かったと火消しに躍起になっている関係者の主張を真っ向から否定するものでもあるわけですが、統計的なものである為に個々のケースが特定されず、常套手段であるところの尻尾切りが使えない、というのが味噌ですね。今度ばかりは角界も年貢の納め時でしょうか。個人的には、相撲自体既に国技と言うにはファン層の偏りが大きいと思うし、別に一般財団法人扱いで何の問題もないと思います。あとNHKの中継廃止も歓迎しますよ。ええ。

7勝7敗なら千秋楽の勝率75% 八百長、統計で証明?

原論文は下記。Levitt教授のHPから。他にも読みやすいフォーマットの別ソースとかもあったけど省略。
Mark Duggan, Steven D. Levitt: "Winning Isn’t Everything: Corruption in Sumo Wrestling", American Economic Review, 2002, 92(5), pp. 1594-605