丿乀庵【へつぽつあん】

へっぽこプログラマーの覚え書き

AKBリクアワ2018の結果と場合の数と確率(18)

≪平山氏の記事の疑問点(7)≫

「NGTの曲が研究生の曲も含めてベスト14に7曲入ることを前提としても、作為性がない場合、NGTの曲が奇数順位だけに入り、研究生の曲が3位になる確率は、手触りに差のない●石6個、❸石1個と○石7個を混ぜ合わせ、目隠しして一列に並べ、●○❸○●○●○●○●○●○となる確率で、
(6/14)×(7/13)×(1/12)×(6/11)×(5/10)×(5/9)×(4/8)×(4/7)×(3/6)×(3/5) ×(2/4)×(2/3)×(1/2)×(1/1)=3,628,800÷87,178,291,200=0.0000416250416となり、2万4千回に1回も起こらない珍事である。したがって、14位以内の曲はすべて正当な得票で集計して14位以内だったと仮定しても、捏造順位である確率は約99.99%でほぼ確実と判断でき」と書かれているが、この考え方は正しいのか。


≪捏造順位である確率と閾値しきい値)≫

平山氏の記事には「捏造順位である確率は約99.99%」と書かれています。

この値は、14個の石を一列に並べたときの並び順が●○❸○●○●○●○●○●○になる確率を百分率(%)にして、100から引いた残りの値だと思います。確率の値は全体を1とした割合なので100倍すると、百分率(%)の値になります。

計算式は以下のようになります。
(●○❸○●○●○●○●○●○になる確率)
 =\frac{1}{24,024}=0.0000416250416

 0.0000416250416×100≒0.00416(\%)
 100(\%)-0.00416(\%)≒99.99(\%)

確率の値について考えるとき、値が0より大きいとき、どんなに小さい値であっても起こる可能性があることに注意する必要があります。起こりにくいだけで、絶対に起こらないというわけではありません。

平山氏の記事で「捏造順位である確率は約99.99%でほぼ確実と判断でき」と断言をさけた微妙な言い方になっているのは、ほんのわずかでも起こる可能性が有ることを意識されているからだと思います。

しかし、「珍事である」、「捏造順位である確率は約99.99%でほぼ確実」と書かれているので、起こる確率が \frac{1}{24,024}になる結果になることは現実的にありえないと判断されていることも確かだと思います。

平山氏の記事に「 \frac{1}{24,000}閾値(しきい値)とする。」と明記されているわけではありませんが、 \frac{1}{24,000}という値を、確率の値がその値より小さくなったら、現実的にあり得ないことが起こったと判断する閾値(しきい値)とみなしていると考えても問題がないと思います。

現実的にあり得ないことが起こったと判断する閾値(しきい値)を使うのであれば、以下の点に注意する必要があると思います。

  • なぜ、その閾値(しきい値)を選んだのか、理由を明示する必要がある。
  • 閾値(しきい値)を決めたら、調べたい結果以外の結果が起こる確率に対してどう影響するかも考える。

平山氏の記事では、上記の二点が不十分だと思われます。

閾値しきい値)を選んだ理由は、平山氏の記事に書かれていないので判断のしようがありません。

そこで、閾値しきい値)を決めたら、調べたい結果以外の結果が起こる確率に対してどう影響するのか、以下の点について考えてみたいと思います。

  • ベスト14の根元事象が起こる確率
  • ベスト14で、●○❸○●○●○●○●○●○に類似した出来事が起こる確率
  • ベスト10、ベスト12、ベスト14と確率を調べる対象範囲が変わったときの確率


以下の記事に続きます。
AKBリクアワ2018の結果と場合の数と確率(19) - 丿乀庵【へつぽつあん】