Бегемот средних широт (bgmt) wrote,
Бегемот средних широт
bgmt

Categories:

автомобиль и коза, пост 1, по существу

В прошлое воскресенье появилось несколько постов на тему вероятностной задачки, известной как "проблема Монти Холла": http://object.livejournal.com/1170003.html, затем "компьютерный эксперимент" тоже у object 'а в http://object.livejournal.com/1170207.html, у avva ( http://avva.livejournal.com/1980790.html) и много где ещё.

Описание задачи стоит здесь снова дать, потому что рыться по ссылкам очень нудно. Вот: "Перед вами три двери. За одной - автомобиль, за двумя другими - козы. Вам нужно угадать, где находится автомобиль. Вы произвольно выбираете одну дверь, после чего ведущий, знающий, за какими дверями что находится, открывает одну из дверей с козой. После чего предлагает вам поменять выбор, если вы сочтете нужным. Нужно ли вам поменять выбор?"

Я ввязался в спор в исходном посте object 'а и был в ответе неправ - более того, довольно агрессивно неправ (хотя затем меня сильно превзошли). В этом посте я объясню, насколько понимаю, что тут правда и почему я был неправ. В следующем посте (завтра?) я напишу, что я думаю о методах ведения спора (в том числе частично покаюсь, но только частично. В частности, я ни секунды не покаюсь, что не признал на следующий же день, что неправ). 


Верный анализ имеется у Аввы в вышеприведённой ссылке (хотя я бы подредактировал немножко его текст). Однако в формулировке Аввы отсутствует очень важное уточнение, данное в каком-то комменте (мне не найти сейчас, я нечаянно закрыл файрфокс, не сохранив конфигурации) rezoner 'ом (я о нём напишу). Вероятно, есть и другие. Однако подавляющее большинство дающих правильный как бы ответ не видит в задаче никаких тонкостей и считает её кристально ясной и недвусмысленно сформулированной. Это не так. Другие - не знаю, большинство ли - считает, что можно "доказать" что-то здесь компьютерной симуляцией. Нет, конечно. Компьютер просимулирует ту задачу, которую вы запрограммировали, и задействует те гипотезы, которые вы забыли или не забыли сформулировать, но которые вложены в вашу программу. Однако если их сформулировать, то симуляция не нужна. Это, конечно, не всегда так - иначе не было бы метода Монте Карло - но в случаях, когда легко написать формулу или нарисовать диаграмму, а вся сложность только в определении элементарных вероятностей, она не нужна: ведь именно эти элементарные вероятности вы вложите в программу руками.

Так вот, гипотеза 1, сформулированная в тексте задачи: дверь выбирается произвольно, стало быть вероятность, что за ней автомобиль, 1/3. Нет смысла изменять эту гипотезу.

Гипотеза 2, тоже сформулированная в тексте задачи: ведущий знает, за какой дверью автомобиль. Несмотря на то, что она есть в тексте, весьма интересно посмотреть, что будет, если ведущий не знает, где что.

Гипотеза 3, отсутствующая в тексте задачи и добавленная Аввой: в случае, если у ведущего есть выбор (он есть, если автомобиль, как ему известно, находится за дверью, выбранной изначально участником), то ведущий выбирает одну из двух дверей с равной вероятностью.

Гипотеза 4, отсутствующая в тексте задачи, не упомянутая (мне кажется) Аввой и добавленная rezoner 'ом в том самом не найденном мною комменте: я (участник) знаю, что ведущий знает, где автомобиль.

Вот теперь можно решать. Решать можно используя формулы условных вероятностей, но мне кажется гораздо нагляднее tree diagram (сэр Антонио, как это по-русски?). Ниже нарисована такая диаграмма для случая, когда удовлетворены все гипотезы.
Этап 1:  я выбираю дверь. Нарисуем выбранную мною дверь первой, я окрасил её в жёлтый цвет.. Есть три равновероятных случая: АКК, КАК, ККА, вероятность каждого 1/3.
Этап 2: ведущий открывает одну из оставшихся дверей. Я окрашиваю её в зелёный цвет.
а) Если автомобиль стоит за моей выбранной дверью, у ведущего есть две возможности, согласно гипотезе 3 - равновероятных, т.е. с вероятностью 1/2. В таком случае вероятность, что я проиграю, сменив дверь на оставшуюся (неокрашенную), равна (1/3)(1/2)+(1/3)(1/2)=(1/6)+(1/6)=1/3. Впрочем, это было легче посчитать, учтя, что в этом  случае я наверняка проиграю (ведь автомобиль стоит за той дверью, которую я как раз сменю на другую!), т.е. вероятность проигрыша (1/3)*1=1/3.
Значит, вероятность выигрыша - 2/3. Однако тут, мне кажется, стоит всё равно разобраться в деталях, потому что одна из самых частых ошибок в вероятностных задачах - это использование сложения вероятностей, которые не складываются (не взаимоисключающие события), и использование формулы Р(А)=1-Р(В) не убедившись, что В = NOT    A.    Здесь-то всё в порядке, но всё же:
б) если автомобиль не стоит за моей дверью, то у ведущего нет выбора. Он выбирает с вероятностью 1 единственно возможную дверь (не мою и не с автомобилем), и вероятность, что автомобиль находится за оставшейся (неокрашенной) дверью равна в каждом случае (1/3)*1=1/3. Таких случаев два (КАА и ККА), значит, в сумме мы имеем 2/3.
Дверь выгоднее сменить.
В диаграмме у стрелок проставлены условные вероятности. Их сумма по горизонтали никак не равна единице, и не должна быть, за исключением начального этапа (1/3 + 1/3 + 1/3). Под каждой конфигурацией проставлены совместные (joint) вероятности. Их сумма по горизонтали равна 1.

Теперь посмотрим, что происходит, если ведущий не знает, где автомобиль. Часть народу решила сформулировать этот случай как  "если ведущий выбирает дверь с автомобилем, мы выбрасываем этот случай и "начинаем сначала"". Это нужно, если мы хотим проводить компьютерный эксперимент. Это совершенно не нужно, если мы просто считаем вероятности. Задача тогда формулируется как "в случае, если ведущий (который не знает, где машина, но знает, какую дверь открыл я, и не будет её трогать) открыл дверь, а за ней коза, что мне выгоднее делать - держаться за изначально выбранную дверь или сменить её на оставшуюся?" Это условная вероятность: Р(выигрыш при смене двери | за открытой дверью коза) = Р(выигрыш при смене двери & за открытой дверью коза) / Р(за открытой дверью коза). То есть это вероятность на урезанном ансамбле, из которого выкинуты случаи, когда за открытой дверью автомобиль. Её проще всего, мне кажется, тоже посмотреть на tree diagram:

В этом случае с вероятностью 1/2 автомобиль находится за моей изначальной дверью или за оставшейся. Менять дверь не имеет смысла, но можно.
Теперь мы подходим к тонкости, указанной rezoner 'ом, которая и является причиной того, что этот второй, как бы противоречащий условию задачи, случай, тоже надо рассматривать: 
первое рассуждение применимо только, если я знаю, что ведущий знает, где машина. Задача сформулирована не как эксперимент, в котором измеряется частота того или иного исхода. Задача сформулирована в терминах "что мне выгоднее сделать". Это выбор стратегии. Вероятность в таком случае является мерой моего знания. (Если я знаю, где автомобиль, я просто сразу выберу верно, и дело с концом). Чтобы вероятность изменилась после открывания двери ведущим, нужно, чтобы мне поступила новая информация. Она действительно поступает, согласно первой диаграмме: я знаю, что выбирая дверь, ведущий использует информацию. Это знание тоже является дополнительной информацией.
Во втором случае всё верно тоже в аналогичном предположении: что я знаю, что ведущий не знает, где автомобиль.
Ну а если просто обратиться к тексту исходной задачи? И тут мы обнаруживаем, что там не сказано, знаю ли я о том, что известно ведущему. Ну, тут можно спорить о формулировках и о неявном смысле высказывания в живом языке. Но так или иначе, интересно следующее: а что я должен делать, если мне и вправду неизвестно, знает ведущий, где машина, или не знает? Он просто взял вот и открыл дверь, за ней коза. Ну как?


В чём была моя ошибка? Я неверно описал для себя ансамбли. (Вероятность - это мера на ансамбле, частота на дискретном ансамбле). Я именно не учёл того, что ведущий, выбирая дверь, сообщает мне новую информацию, и две оставшиеся двери - моя изначальная и оставшаяся - оказываются неравноправны. Вероятность действительно не имеет истории, когда два последовательных события независимы. Однако выбор двери ведущим не независим от моего изначального выбора двери. Каюсь.
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 65 comments