丿乀庵【へつぽつあん】

へっぽこプログラマーの覚え書き

AKBリクアワ2018の結果と場合の数と確率(10)

≪平山氏の記事の疑問点(5)≫

AKBリクアワ2018は全部で 1,078曲を対象にしたランキングなのに、ベスト14だけを対象にして確率を求めて、その結果をもとに不正があったと判断しているのは、なぜなのか。


≪ランキングの対象曲数の違い≫

 1,078曲を対象にしたランキング結果の中で、ベスト14の結果がどうなるかを確率を使って調べるときに、いろいろな方法があります。以下に2つだけあげておきます。

  • ベスト14だけを対象にして、ベスト14が特定の条件になる確率を調べる。
  • 15位以降の曲はどういう並び順になっていても構わないという前提で、 1,078曲を対象にしてベスト14が特定の条件になる確率を調べる。

ベスト14だけを対象にしたときよりも、 1,078曲を対象にしたときのほうが、全ての場合の数と求める場合の数が大きくなることに注意が必要です。ベスト14が14個の数字の掛け算なのに対して、 1,078曲を対象にしたときは  1,078個の数字の掛け算になります。

分数の値を比較するときに、分子の数が同じときは、分母の数が大きいほうが分数の値が小さくなります。(例: \frac{2}{5}<\frac{2}{4}<\frac{2}{3}

そのため、同じような条件でも、曲数が多い  1,078曲を対象にした確率の値のほうが小さくなる可能性があることに注意が必要です。(曲数が多いほうが確率の値が大きくなることもあります)

また、 1,078曲を対象にしたときは、○石・●石の両方とも14個以上あるので、ベスト14で14個全て○石になる[条件10-1]や、14個全て●石になる[条件10-2]を満たす確率を計算できます。

[条件10-1]○○○○○○○○○○○○○○
[条件10-2]●●●●●●●●●●●●●●

[条件10-1]や[条件10-2]を満たす確率は、ベスト14で、●○❸○●○●○●○●○●○となる確率について考えるときに、比較対象として使うことができる値ですが、○石7個・●石7個を対象にしたときは、その確率を求めることができません。

 1,078曲を対象にすると、場合の数が大きくなりすぎる一方で、確率の値が小さくなりすぎます。その結果、場合の数と確率のどちらの値も指数形式の概算値(例: \ 3.415×10^{19})で求めることになるという問題があります。

そういった問題があることを考えると、平山氏がベスト14だけを対象にして確率を計算されたのも、しかたがないのかなという気がします。

ただ、同じような条件でも、ベスト14だけを対象にしたときよりも、 1,078曲を対象にした時の方が確率の値が小さくなる可能性があることに注意が必要です。


以下の記事に続きます。
AKBリクアワ2018の結果と場合の数と確率(11) - 丿乀庵【へつぽつあん】