丿乀庵【へつぽつあん】

へっぽこプログラマーの覚え書き

AKBリクアワ2018の結果と場合の数と確率(5)

≪平山氏の記事の疑問点(1)≫

平山氏の記事では、以下の2点を理由に、AKBリクアワ2018のベスト14は捏造順位であることがほぼ確実と判断しているが、その考え方に問題はないのか。

  • ランキング結果のベスト14で、1位、5位、7位、9位、11位、13位がNGTの曲、3位がNGT研究生の曲になる確率(場合の数を使う確率)が極端に低い。
  • 実人気を考慮すると、正当な投票で研究生の曲以外のNGTの曲がベスト14に6曲以上入る可能性はほぼ皆無NGT研究生の曲が3位以内になる可能性もほぼ皆無である。


≪現実と計算結果の違い≫

AKBリクアワ2018の結果に限らず、世の中の出来事の結果や、その結果の起こりやすさを、計算で求めて判断することはよくあると思います。

そのときに注意しなければいけないことがあります。それは、世の中の出来事の結果や、その結果の起こりやすさには、バラツキや偏り(かたより)があるということです。なぜ、そうなるかというと、原因となる出来事にバラツキや偏り(かたより)があるからです。

バラツキや偏りがあるからこそ、ある出来事の起こりやすさを求めるために確率の計算をするわけです。

しかし、場合の数を使う確率では、結果の起こりやすさにはバラツキがありません。結果の起こりやすさは「同様に確からしい」ことが前提になっているからです。

「同様に確からしい」とは、どういうことかというと、起こる可能性がある結果が起こる確率は全て同じになるということです。起こる可能性がある結果の個数が100個あったら、実際の結果がどんな結果になったとしても、その結果の起こりやすさは \ \frac{1}{100}\ になります。

AKBリクアワ2018のような人気投票ランキングの場合、ランキング結果がどのような結果になったとしても、結果の起こりやすさは全て同じであるという前提で考えることになります。

全ての結果が起こる確率が同様に確からしくなることを前提にするので、楽曲の人気投票ランキングの結果の起こりやすさを確率として求めるときは、曲ごとの人気度合いの違いを考慮することができません。全ての曲の人気度合いは同じであるという前提で考えることになります。

平山氏の記事に、「作為性がない場合、NGTの曲が奇数順位だけに入り、研究生の曲が3位になる確率は、手触りに差のない●石6個、❸石1個と○石7個を混ぜ合わせ、目隠しして一列に並べ」と書かれているのは、並べた結果が同様に確からしい結果になるように、石を選んで、並べている、ということをいいたいのだと思われます。

平山氏が、同様に確からしい結果になる確率と、曲によってバラツキがある実人気の違いの、両方を考慮して不正があったかどうかを判断しているのは、間違っていないと思います。

問題だと思うのは以下の点です。

  • 確率を求めるときに、グループごとの曲数の違いを考慮していない。
  • 確率を求めるときに、●石(NGTの曲)が特定の条件を満たす確率の値しか求めていない。
  • AKBリクアワ2018の順位は、実人気の順位に近いものになると考えているようだが、実人気の順位を求める方法が書かれていない。
  • AKBリクアワ2018の順位と実人気の順位が近いものになる理由が書かれていない。


以下の記事に続きます。
AKBリクアワ2018の結果と場合の数と確率(6) - 丿乀庵【へつぽつあん】