Статьи

Являются ли эти «ошеломляющие» шансы действительно такими ошеломляющими?

Я должен был взять отпуск, но Фредерик, профессор в Туре, вернулся ко мне сегодня утром с щекочущим вопросом. Он спросил меня, каковы шансы на то, что ничья в Лиге чемпионов дает точно такие же пары, как и на тренировочной ничьей, и официальную — случай, который  Daily Mail  описывает как «ошеломляющий» с коэффициентами 2 000 000 к 1?

Честно говоря, я не очень разбираюсь в футболе, так что вот что произошло, с тренировочной (слева, 19 декабря) и официальной (справа, 20 декабря),

УЕФА

Понятно, что пары идентичны, но не порядок. На самом деле, сначала я был удивлен, что даже то, какая команда играет дома сначала, было идентично. Но (это звучит так), что команды, которые играют дома первыми, заканчивают вторыми после предыдущего этапа соревнований.

И чтобы быть более точным в этих розыгрышах, эти пары были получены с использованием настоящих урн, настоящих шаров, так что это чистая случайность (опять же, насколько я понял). Но с очень конкретными правилами. Например, две команды из одной страны не могут играть вместе (или одна против другой) на этом этапе. Или команды, которые закончили первыми после предыдущего хода, могут играть только с (или против) командами, которые закончили вторыми. На самом деле, Фредерик прислал мне   файл xls с матрицей возможностей.

Давайте найдем все возможные пары, независимо от того, какая команда играет дома в первую очередь (опять же, нам все равно, так как порядок определяется правилом, упомянутым выше). Математика могла бы быть немного сложной, со всеми этими ограничениями. С помощью небольшого кода можно перечислить все возможные пары для этих восьми игр. Давайте импортируем нашу матрицу возможностей,

 > n=16
 > uefa=read.table(
 + "http://freakonometrics.blog.free.fr/public/data/uefa.csv",
 + sep=",",header=TRUE)
 > LISTEIMPOSSIBLE=matrix(
 + (rep(1:n,n))*(uefa[1:n,2:(n+1)]=="NON"),n,n)

Я могу починить первую команду (в моем списке четвертая — первая команда, которая заняла второе место). Затем я смотрю на все возможные второй (который будет играть с первым),

 > a1=1
 > "%notin%" <- function(x, table){x[match(x, table, nomatch = 0) == 0]}
 > posa2=((a1+1):n)%notin%LISTEIMPOSSIBLE[,a1]

Затем рассмотрим вторую команду, которая заняла второе место (шестая в моем списке) И посмотрите на всю возможную четвертую команду (которая будет играть в этой второй игре), то есть, исключая ту, которая была уже сыграна вничью, и те, которые не возможны,

 > b1=6
 > posb2=(1:n)%notin%c(LISTEIMPOSSIBLE[,b1],a2)

И т.д. Итак, учитывая список домашних команд,

 > a1=4
 > b1=6
 > c1=8
 > d1=9
 > e1=12
 > f1=14
 > g1=15
 > h1=16

рассмотрим следующие циклы,

 > posa2=(1:n)%notin%c(LISTEIMPOSSIBLE[,a1])
 > for(a2 in posa2){
 + posb2=(1:n)%notin%c(LISTEIMPOSSIBLE[,b1],a2)
 + for(b2 in posb2){
 + posc2=(1:n)%notin%c(LISTEIMPOSSIBLE[,c1],a2,b2)
 + for(c2 in posc2){
 + posd2=(1:n)%notin%c(LISTEIMPOSSIBLE[,d1],a2,b2,c2)
 + for(d2 in posd2){
 + pose2=(1:n)%notin%c(LISTEIMPOSSIBLE[,e1],a2,b2,c2,d2)
 + for(e2 in pose2){
 + posf2=(1:n)%notin%c(LISTEIMPOSSIBLE[,f1],a2,b2,c2,d2,e2)
 + for(f2 in posf2){
 + posg2=(1:n)%notin%c(LISTEIMPOSSIBLE[,g1],a2,b2,c2,d2,e2,f2)
 + for(g2 in posg2){
 + posh2=(1:n)%notin%c(LISTEIMPOSSIBLE[,h1],a2,b2,c2,d2,e2,f2,g2)
 + for(h2 in posh2){
 + s=s+1
 + V=c(a1,a2,b1,b2,c1,c2,d1,d2,e1,e2,f1,f2,g1,g2,h1,h2)
 + cat(s,V,"\n") 
 + M=rbind(M,V)
 + }}}}}}}}

С опцией печати мы в конечном итоге

5461 4 13 6 11 8 5 9 2 12 10 14 3 15 7 16 1 
5462 4 13 6 11 8 5 9 2 12 10 14 7 15 1 16 3 
5463 4 13 6 11 8 5 9 2 12 10 14 7 15 3 16 1

т.е.

> nrow(M)
[1] 5463

возможные пары (список можно найти здесь, где номера такие же, как в   файле csv ). Какова была вероятность, упомянутая в комментарии в статье, упомянутой ранее  dailymail.co.uk/… . Таким образом, вероятность получить точно такой же результат после практики и официальных розыгрышей была (в%)

> 100/nrow(M)
[1] 0.01830496

Но это не  что  мало , когда мы думаем об этом ….

И если у кого-то есть математическое выражение для этой вероятности, мне это интересно. Единственный надежный метод, который я нашел, — перечислить все возможные пары (   файл csv доступен, если кто-то хочет проверить). Но я не удовлетворен …