Мыслим #14 Так или эдак: шансы, варианты, совпадения


Принцип пересекающихся знакомых
Вероятность встретить приятелей возрастает, если вы идёте с персоной, знакомство с которой вам не хотелось бы афишировать.

Причуды теории вероятности

Какова вероятность того что выйдя на улицу, Вы встретите динозавра?

Наряду со вполне понятным и корректным ответом: «Стремиться к нулю», возможен ответ «Нулю». Последний не столь корректен, так как в обычном смысле шанс мал – но он есть. Достаточно вспомнить открытие живой древней кистепёрой рыбы целоканта — она имела тот же самый вид, что и в эпоху динозавров. Но существует и иной ответ: «50%», ну или простыми словами: «либо встречу, либо нет». На самом деле при всей неожиданности и даже шутливости последнего ответа всё определяется тем, как мы определим так называемое пространство состояний, то есть множество допустимых ответов/значений. В классической теории вероятности и статистике это непрерывный отрезок действительных чисел $[0,1]$. Однако если работать в двоичной логике $\{Да, Нет\}$ , то шутливый ответ становится корректным и осмысленным.
В качестве дополнительной информации для размышлений приведём три подтверждённых факта:
  • «Сколько пальцев у Вас на руке?» Пять? А вот и нет. Начиная от травм, когда человек может потерять один или несколько пальцев, вплоть до нескольких подтверждённых фактов мутаций с рождением шестипалых людей. Получается, что в рамках нашего опыта любое число от нуля до шести будет верным, а пять — наиболее вероятным.
  • «Сколько сосков у кошки, свиньи и т.п.?» Можете поймать кошку или прогуляться до ближайшей свинофермы. Или просто открыть ветеринарный справочник. Только не забудьте о том, что у многих животных неоднократно фиксировалось появление дополнительной пары сосков. Так что возможность такой мутации в природе далека от нулевой и Ваш «точный» ответ лишь сообщит о наиболее вероятном количестве.
  • «Сколько лап у зайца?» В 1869 году в лесу под Краковом (Польша) был подстрелен восьминогий заяц и долгое время был экспонатом в Львовском природоведческом музее (Украина). Так сколько лап у зайца?

Невероятно то, что особенно вероятно

Данное высказывание Аристотеля кажется как минимум странным, если не вообще противоречивым. Что же хотел нам сказать знаменитый логик и философ древности?
Для начала рассмотрим несколько совпадений и странных последовательностей:
Если записать первые буквы названий месяцев на английском, получим цепочку JFMAMJJASOND которая содержит имя древнегреческого героя Язона (JASON). Правда на русском в цепочке ЯФМАМИИАСОНД ничего столь длинного нет. Только трёхбуквенное СОН.
Записав на английском первые буквы названий планет MVEMJSUNP обнаружим среди них имя нашей звезды SUN (Солнце). На русском правда всё совсем плохо. В последовательности МВЗМЮСУНП нет ничего осмысленного.
Среди цифр, образующих запись числа Пи, были обнаружены забавные подпоследовательности, например: 3333333, 4444444, 8888888, 1212121, 1234567, 7654321. То есть некоторые последовательности (серии) чисел в записи Пи можно обнаружить с ненулевой вероятностью.
Доказать вероятность невероятного можно с помощью натурного эксперимента со специальным волчком на гранях которого нанесены буквы алфавита (любого, не обязательно латинского или кириллического). Запустите волчок сто раз подряд и записывайте последовательность из букв, на которых волчок упал при своей остановке. С огромной вероятностью в этой последовательности обнаружится по крайней мере одно трёхбуквенное слово, может даже несколько. Появление более длинных слов менее вероятно, но продолжив запускать волчок мы обязательно встретим первое четырёхбуквенное. На самом деле поразительно как часто в такой случайной последовательности будут находиться трёхбуквенные слова. Если у Вас нет волчка, то подобный эксперимент можно произвести на компьютере, генерируя последовательность случайных цифр в качестве порядкового номера буквы в алфавите. Простейшая программа и всего один запуск (для честности эксперимента) дал мне последовательность (искусственно поделена на четыре куска):
ДЩЮПШРСЧШЫЫМЖЗЛОАЕЛЪЁВМКС
ШВВИШИЩЖБЗУГЛСИНЗКЧЖШРПЕП
ХУЗГСЕИБХОЪЙВДЙЙГЩФЫЙЬЕЮЦ
ОЮЙХВПАДБТЮЬЭПЭВБКШНШЦЖМХ
в которой подчёркнуты найденные слова. Всего два и коротких. Для полноты эксперимента я запустил программу ещё раз:
ЗФЮЗВДВЗЦЬОЫВВЁИДЯЬАСЗКЗЦ
КЭЖЪЪБЯЗЬМНЗУМЫНДПУУДВФЯГ
ЪЦГУФДЯЛЫАЫЫБСЮУГКЪПМТРР
МИЛХЛЪЯДМОВЖЗМЦНШЩКСЖЭПЦТО
обнаружив пять слов (МИЛ, ИЛ) и одно из 4-х букв!
Эксперимент с буквами показывает, что совпадений может быть много даже в повседневности, и их нельзя считать невероятными и, тем более, приравнивать к чуду.

Мир тесен

Рассмотрим пример реального диалога в самолёте изменив только имена:
Два незнакомых прежде пассажира.
Д. – Так Вы из Бостона! Моя хорошая знакомая Люси Джонс работает там адвокатом.
Т. — Подумать только! Моя жена дружит с Люси уже много лет.
Кажется, что шанс такого совпадения крайне мал. Но статистики показали, что это не так.
Оказывается, мир тесен и без технологий
Исследования такого рода проходили двояко. Первые использовали идеи и аппарат математической статистики напрямую, обрабатывая списки знакомых членов исследуемых групп. При этом оказалось, что в США произвольный житель в среднем знает 1000 человек. То есть вероятность того что они знакомы напрямую мала, одна тысячная процента. А вот вероятность наличия одного общего знакомого уже около 1%. Немного, но значительно лучше вероятности прямого знакомства. А вероятность знакомства через цепочку из двух посредников (Люси и жена) превысила 99%. Поскольку этот результат оказался настолько поразительным, то в него трудно поверить.
Поэтому был предложен другой формат эксперимента, когда произвольно выбранной группе отправителей было предложено переслать документ неизвестному ему получателю из другого штата. Он должен был сделать это отослав документ одному из своих друзей или хороших знакомых, которые, по его мнению, могут знать нужного адресата. Дополнительно у начальных отправителей спрашивали, сколько посредников, по их мнению потребуется, прежде чем послание попадёт к адресату. Люди считали что потребуется порядка сотни посредников. Тем не менее, собрав реальные результаты исследователи обнаружили что на самом деле потребовалось всего от 2-х до 10-ти посредников. С медианой равной 5-ти. То есть с вероятностью 50% число посредников не превысит пять человек.
Вполне возможно, что с развитием информационных технологий (особенно социальных сетей) эти оценки даже улучшились, но как само явление «сеть общих знакомых» может объяснить некоторые странности в скорости распространения информации по частным каналам: от слухов и секретов до анекдотов.

Мальчики — девочки

У мистера Смита двое детей. Хотя бы один ребёнок — мальчик. Какова вероятность того, что и второй — тоже мальчик?
Если начать разбираться, обнаруживается любопытное обстоятельство: правильный ответ будет отличаться в зависимости от того, каким образом мы будем подсчитывать вероятность пола другого ребёнка.
Вариант 1. Рассмотрим все возможные комбинации в семьях с двумя детьми:
  • Девочка/Девочка
  • Девочка/Мальчик
  • Мальчик/Девочка
  • Мальчик/Мальчик
Вариант девочка/девочка нам не подходит по условиям задачи. Поэтому для семьи мистера Смита возможны три равновероятных варианта — а значит, вероятность того, что и другой ребёнок тоже окажется мальчиком, составляет $\frac{1}{3}$.
Вариант 2. Поскольку пол второго ребёнка никак не зависит от пола первого, правильным ответом является $\frac{1}{2}$.
Все зависит от того, как мы подходим к вопросу подсчёта вероятности. В первом случае мы рассматривали все возможные варианты семьи Смита. Во втором – мы рассматривали все семьи, подпадающие под обязательное условие «должен быть один мальчик». Расчёт вероятности пола второго ребёнка вёлся (хоть и неявно) с этим условием (в теории вероятностей это называется «условная вероятность»), что и привело к результату, отличному от первого.

Поспешные выводы

Скрытой стороной вопроса о возможности, невозможности и наиболее вероятном результате является поспешное принятие решений, когда выбор результата на основе собственного опыта ещё хоть как-то оправдан. Любые другие обоснования могут приводить не просто к неверному ответу, но и отвлекать от строгого анализа из-за своей «внешней привлекательности». Рассмотрим несколько проблемных примеров.
  • Дорожная статистика показывает, что большинство аварий приходится на автомобили, передвигающиеся с умеренной скоростью. А среди любителей погонять — очень мало. Не означает ли это что быстрая езда безопаснее?
На самом деле, конечно, нет. Дело в том, что водителей, соблюдающих скоростной режим значительно больше, поэтому и аварий среди них количественно больше. Дело ведь не только в вероятности попасть в аварию, а больше в тяжести последствий не для автомобиля, а для пассажиров, водителей и пешеходов.
  • Часто приходится слышать о попадании в аварию рядом с собственным домом. Означает ли это что мчаться по загородному шоссе безопаснее?
Конечно нет. Просто статистика отражает что близких поездок куда больше, чем далёких с одной стороны, а с другой, когда едут на работу можно не полностью проснуться (замедленная реакция) или торопиться (недооценка потенциально опасных ситуаций). При возвращении с работы закономерны общая усталость и желание побыстрее попасть домой. Отсюда невнимательность (замедленная реакция) и та же недооценка потенциально опасных ситуаций.
  • Если смертность от туберкулёза выше в области Н., то Означает ли это что её климат способствует развитию туберкулёзной палочки?
Если говорить об историческом прошлом, то ответ должен быть подтверждающим. Но если думать о современной медицине, то скорее всего наоборот, климат области Н. наоборот способствует выздоровлению, и больные туберкулёзом стремятся приехать туда на лечение. Как следствие — количество именно таких больных высоко и из-за тяжести болезни не всех удаётся вылечить. Отсюда повышенная смертность.
  • Исследование в школе показало, что дети с большим размером ноги пишут грамотней. Неужели размер обуви служит показателем грамотности?
На самом деле нет. Просто опрос включал учеников различных возрастов, и никто не учёл, что дети продолжают учиться и повышать свою грамотность. Всё это проходит на фоне физического роста, в частности — увеличения размеров обуви.
  • Несколько раз появлялись заметки что в городе Н. резко выросло количество сердечно–сосудистых заболеваний на фоне резкого роста потребления пива. Неужели пиво действительно так вредно для сердца?
Как показало стороннее рассмотрение вопроса, увеличение обоих чисел произошло после заметного увеличения численности жителей, то есть рапортовали абсолютные значения вместо относительных.
  • Забавное исследование показало, что если в семье кто-то становился математиком, то обычно это был старший сын. Неужели математические способности младших сыновей ниже?
Нюанс в том, что порайонно наблюдаются статистические выбросы. В некоторых местах большинство первых детей ($\approx 50%$) мальчики. В других — наоборот девочки. Исторически большее внимание уделяют первому ребёнку, чтобы он получил высшее классическое образование и смог потом помогать младшим детям. Кроме того, исторически и совершенно необоснованно часть профессий считаются мужскими. Понятно, что при такой совокупности факторов часть старших мальчиков стали именно математиками позволив младшим избрать другую профессию.
Как следует из этих примеров прямое сопоставление статистических результатов или напрямую нарушает причинно–следственные связи, или ограничивается поверхностным (заметно сразу) рассмотрением.

Предложение не прошло

Предложение не было одобрено на референдуме. Если бы больше людей проголосовало против, его бы одобрили. Как такое возможно?
Математики и статистики в особенности очень не любят работать с цифрами в привязке к политике и голосованиям. Для этого приведём формальное решение задачи и остановимся на его подводных камнях. Итак,
Хотя на референдуме 35% проголосовали за и всего 14% против, в целом голосов было недостаточно, чтобы достичь кворума. Требовалось, чтобы в референдуме приняло участие не менее 50% населения, и тогда его результаты считались бы действительными. Таким образом, если бы голосовало немного больше людей, хоть и против, то даже ещё 1% таких участников сделал бы референдум действительным и предложение референдума было бы принято.
Вопросы о кворуме, квалифицированном, абсолютном и прочих большинствах являются наибольшей проблемой, так как только юристы точно знают о каком проценте идёт речь в данном конкретном случае. Если про «простое большинство» давно оговорено что это 50%+1 голос, то другие нормы могут требовать, например 70-80% для квалифицированного или 90-100% для «абсолютного». Поэтому при наличии факта голосования всегда нужно уточнять критерии голосования по каждому конкретному пункту или вопросу.
Причём некоторые слова–дополнения в описании процесса и результата голосования тоже могут иметь специфичное значение. Например «полный кворум» означает не ещё один процентный промежуток, а достижение той самой минимальной грани хх%+1голос.

Тайны спортивного судейства

В век телевидения и интернета сложные вещи стало легко объяснить, но в объективности некоторых суждений мы продолжаем сомневаться. Некоторые из таких вещей продолжают вызывать высокий эмоциональный накал, и оценка спортивных соревнований в особенности. Десять, или около того, судей одновременно вытаскивают из своего запаса карточки, на которых изображены баллы. Обычно оценка выступления происходит в два приема — за технику исполнения и за художественное впечатление (артистичность).
Показания судей за вычетом самого высокого и самого низкого складываются, и сумма баллов служит мерой спортивного успеха.
Конечно, баллы разных судей могут и не совпадать. Но различия в оценках, которые дают специалисты, совершенно пустяковые. И это обстоятельство вселяет уверенность в сердце каждого исполнителя и зрителя в полной объективности этого суда. Но одновременно такое поразительное единодушие судей удивляет неопытного зрителя. Действительно, все участники одинаково ловки, никто не упал, никто не сорвался... Но спустя некоторое время вы начинаете понимать, что пять баллов это одно, а пять и шесть десятых — это совсем другое.
Бег на сто метров? Обойдемся без судей. Метание диска? Судьи не нужны... Но там, где результат соревнований определяется четкостью, изяществом, смелостью движений, то есть в тех случаях, где спортивные достижения не могут характеризоваться метрами, секундами и килограммами, механизация судейства невозможна. Попробуйте разобраться в чём дело.
Вероятно, даже сам судья затруднился бы исчерпывающим образом объяснить, почему для одного спортсмена у него рука потянулась к табличке с пятью баллами, а для следующего он, не колеблясь, схватился за шестёрку. И правда, попробуй объясни. В мозгу запечатлелись маленькие неудачи: небольшое нарушение устойчивости, немного согнутые колени, неточность приземления; и маленькие выигрыши: изящный выгиб спины, стремительность полёта... Мозг с поразительной быстротой сопоставлял наблюдаемое зрелище с аналогичными картинами тысяч виденных ранее гимнастов или фигуристов. Память мгновенно перебрала все эти картины, отмечая тех, кто «работал» лучше, и тех, кто «работал» хуже. Спортсмен, подлежащий суду, зафиксировался в определенном месте этого ряда, и возникала оценка — только такая, и никакая другая.
Не надо слишком расстраиваться тем, что балл, показанный каждым из судей, неизбежно несёт на себе отпечаток его индивидуального вкуса. При выводе среднего балла положительные и отрицательные отклонения сокращаются, и результат налицо — объективная балльная система существует.
Десять оценок — это, конечно, мало, чтобы построить кривую распределения и посмотреть, относится ли она к классу нормальных. Однако нет особых оснований в этом сомневаться: оценки судей (при условии, конечно, что они по-настоящему беспристрастны) легли бы на обычную гауссову кривую, ибо отклонения от средней оценки диктуются случайностями, то есть очень большим числом факторов, которые совершенно невозможно учесть.
Большую чёткость в понимании вопроса можно получить замахнувшись на оценки эстетических (культурных) предпочтений.
Усреднение должно произвести нивелировку тех различий в оценках, которые вызываются индивидуальным воспитанием и различием в характерах опрашиваемых. Разнобой во вкусах хорошо известен и естествен, поэтому не надо удивляться тому, что один и тот же кинофильм может получить диаметрально противоположные оценки даже двух товарищей-одногодков, работающих в одном учреждении на одинаковых должностях. И тем не менее закон среднего сработает, и разнобой во мнениях среди членов однородной группы будет встречаться несравненно реже, чем совпадение в оценках.
Однако не следует ограничиваться выводом среднего балла. Наши тысячи анкет позволяют получить более богатую информацию об эстетическом вкусе участников эксперимента. Можно построить кривую распределения и посмотреть, похожа ли она на нормальную колоколообразную кривую, характерную согласно теории вероятностей для случайных событий.
С этой целью придется разложить анкеты по стопкам, в каждой стопке анкеты с одинаковыми баллами. Затем надо пересчитать анкеты и выяснить, какой процент опрошенных из данной узкой группы выставил оценку 0, какой процент — +1, -1 и т. д. После этого можно переходить к графическому построению.
Проведем горизонтальную линию на клетчатой бумаге и проставим в середине 0, через клетку вправо отложим +1, еще через клетку — +2 и т. д. таким же образом влево отложим отрицательные баллы. Из каждой отметки восстановим перпендикуляр — вертикальный отрезок, длина которого в каком-либо масштабе должна быть равна соответствующему проценту опрошенных. Если теперь провести через вершины всех вертикалей плавную линию, то получим кривую, характеризующую эстетический вкус (по отношению к исследованной теме) всего круга людей, привлеченных к эксперименту.
Если кому-либо покажется святотатством иллюстрировать таким образом (такими графиками) исследования в области эстетики, то можно ограничиться двумя важными понятиями, уже знакомыми читателю. Одно из них — разумеется, средний балл. Очевидно, это будет точка горизонтали, лежащая под максимумом нашей кривой. Второе — степень единодушия в оценке. Что эго такое?
Представьте себе два опроса, один из которых привел к узкой кривой с острым максимумом, а другой — к пологой кривой, охватывающей весь интервал оценок и лишь незначительно возвышающийся в месте своего максимума. В первом случае подавляющее большинство опрошенных держится одного мнения; во втором — нет единодушия, мнения разделились, и каждый балл встречается почти одинаковое число раз. Чем измерять в этих случаях степень единодушия? Очевидно, его будет характеризовать полуширина колокола.
Нет сомнений, что многие произведения литературы, живописи, музыки, будь то поэма, картина или песня, оставляют людей равнодушными. В этом случае результатом опыта будут, очевидно, колоколообразные кривые с максимумом в ноле, а число отрицательных и положительных мнений окажется примерно одинаковым.
Внутри одной группы оценка красоты может быть вполне единодушной, мнения же двух разных групп будут расходиться кардинально. Скажем, исследуйте отношение к детективному роману студентов физического факультета университета и женщин пенсионного возраста, и я не сомневаюсь, что вы получите очень разные кривые, с разным расположением максимума относительно ноля.

Теория рекламы

Каждый из нас хоть единожды, но возмутился однобокостью рекламы. А уж от её назойливости страдали все. Так есть ли осмысленное обоснование таким действиям?
В качестве готового ответа приведём рассказ одного американского математика.
Мой знакомый — американский математик мистер В., ранее занимавшийся достаточно успешно приложениями теории вероятностей к вопросам структуры жидкостей, переменил область своей деятельности.
— Я занимаюсь теорией рекламы, — сообщил он мне при последней нашей встрече.
— И это интересно?
— Бесспорно. Здесь много занятных тонкостей.
— А, собственно говоря, что же является конечной целью теории?
— Хотя бы получение ответа на вопрос, который интересует любого нашего промышленника: сколько денег имеет смысл потратить на рекламу?
— Но каковы же математические методы, которые вы используете?
— Да все те же, с которыми я имел дело до сих пор. Теория рекламы, теория популярности актера, теория известности писателя, прогноз бестселлеров литературы — всё это классический предмет теории вероятностей. Не я один, а много моих коллег заняты этим приложением теории вероятностей к проблемам нашей капиталистической действительности.
— Может быть, вы расскажете мне о наиболее интересных теоретических находках в этой области?
— С удовольствием. Надеюсь, мне не надо доказывать вам, что, прежде чем добиться того, чтобы вещь, или событие, или некая персона понравились, надо, чтобы они стали известными потребителю?
— Без сомнения.
— Поэтому не будем пока касаться проблемы «нравится», а остановимся на вероятности получения неким гражданином сведений о существовании сигарет Честерфилд, лезвий для бритья фирмы Вильсон, романа Агаты Кристи «Убийство по азбуке» или киноактрисы Бетти Симпсон. Мы оставим в стороне систематические знания, приобретаемые в результате обучения в школе или университете, и будем интересоваться лишь теми сведениями, которые люди приобретают «на ходу», не преследуя образовательных целей. На каждого из нас через разные каналы: радио, газеты, телевидение, болтовню с друзьями — обрушивается мощный поток информации, получаемой «по случаю». Фамилии актеров, названия книжных новинок, новых сортов сигарет, лезвий для бритья и многое другое мы узнаем большей частью случайно. В зависимости от размаха рекламы, от интереса, который общество проявляет к тому или иному «модному» предмету, имеется некоторая определенная вероятность о нём услышать. Эта вероятность более или менее одинакова для однородней группы населения — скажем, для жителей города, имеющих телевизоры и радиоприемники и выписывающих две-три наиболее распространённые газеты.
Разумеется, равная вероятность получить информацию вовсе не означает, что по истечении какого-либо срока все люди окажутся одинаково сведущими. Случайное получение информации очень похоже на лотерейный выигрыш. Действительно, среди тысячи обладателей по десяти лотерейных билетов окажутся лица, которые не выиграют ни разу, которые выиграют один раз, найдутся обладатели двух счастливых билетов, будут и такие везучие игроки, у которых выигрыши выпадут на три, четыре и более билетов. Так что...
— Вы хотите сказать, что вероятность «столкновения» с рекламой, вернее, не с рекламой, а с упоминанием о предмете или лице, известность которого обсуждается, подчиняется распределению Пуассона?
— Совершенно верно. Если, скажем, вероятность натолкнуться па соответствующую информацию в течение одного дня равна одной сотой, то через сто дней процентов населения, так сказать, омываемого этим потоком информации, так и не столкнется с этой рекламой, другие процентов встретятся с упоминанием о рекламируемом предмете раз, процентов — два раза. 6 процентов — три раза и т.д. Эти числа, как вы, конечно, помните, дает закон Пуассона.
— Значит, при вероятности узнавания, равной одной сотой в день, через сто дней обеспечивается известность среди процентов населения?
— Не совсем так. У людей, к сожалению торговцев, память коротка, да и жизнь суматошная. С одного взгляда на рекламу мало кто запоминает рекламируемую вещь.
— Так что у вероятности узнавания имеется еще и второй множитель?
— Вот именно!
— А какова величина этой поправки на невнимательность?
— Разумеется, она различна в зависимости от того, о чем идет речь. Я могу вам сообщить, к примеру, данные, полученные из анализа анкет, распространявшихся среди телезрителей. Из этих данных была вычислена вероятность запоминания с одной встречи. Оказалось, что она колеблется между 0.01 и 0.1.
— Существенная поправка к распределению Пуассона!..
— Конечно. Судите сами: если подсчитать процент населения, который получит информацию через сто дней, то из 37 процентов «столкнувшихся» с рекламой один раз, информированными окажутся лишь 3.7 процента (если мы примем вероятность запоминания с одной встречи равной 0.1). Из 18 процентов «сталкивавшихся» с информацией два раза доля лиц, усвоивших рекламу, будет больше. Действительно, вероятность не запомнить с одного раза равна 0.9, а не запомнить после двух встреч равна квадрату этой величины, то есть 0.81. Запомнивших будет 0.19. Таким образом, процент информированного населения в нашем примере будет подсчитываться так:
\[37\cdot 0.1 + 18\cdot 0.19 + 6\cdot 0.27 + \ldots\]
— Да, до 63 процентов далеко!..
— Вот этот коэффициент невнимательности и приводит к необходимости назойливой, торчащей на всех углах рекламы. Чтобы каждый потребитель узнал о товаре, он должен сталкиваться с соответствующей информацией очень часто.
— Мы всё время говорим с вами об известности. Но ведь знать — это ещё не значит предпочитать!
— Так-то оно так, — улыбнулся мой собеседник.— Но роль рекламы оказывается решающей. Недостаточная реклама означает малую известность, а малая известность влечет двойной проигрыш в конкурсе на высшую оценку. Первая причина ясна. Те, кто не знает, естественно, не могут подать голос за то, что им неизвестно. Вторая причина состоит вот в чём. Менее популярные вещи, книги, актеры, писатели... известны наиболее образованным людям. Но поскольку они образованны, они делают свой выбор среди значительно большего числа конкурентов. По этой причине вероятность высшей оценки предмета или объекта, который выбирается знатоками, становится меньше вероятности высшей оценки, которую выносит менее осведомлённый судья.
— Я начинаю теперь понимать, почему в вашей стране тратят столько денег на рекламу!
— Ещё бы!.. Вот вам простая числовая иллюстрация. Имеется 10 лучших ресторанов в городе. Из них два, скажем, «Империал» и «Континенталь», разрекламированы много более других. Гурманы знают о существо вании всех десяти ресторанов, которые примерно одинаково хороши. Случайные же посетители ресторанов, как правило ужинающие у себя дома, знают лишь о существовании «Империала» и «Континенталя». Положим, что тысяча человек собирается сегодня вечером поужинать вне дома. Из них 500 знатоков и 500 профанов. На первый взгляд может показаться, что менее разрекламированные рестораны не будут в проигрыше. Однако, будут — и в очень большом! 500 профанов с вероятностью 1/2 выберут один из двух наиболее известных ресторанов. Из них 250 очутится в «Империале» и 250 в «Континентале». А 500 знатоков с вероятностью 1/10 выберут один из десяти ресторанов. Таким образом, в «Империале» и «Континентале» окажется по 300 человек, а в остальных 8 ресторанах — по 50. Как видите, наименее компетентные потребители играют решающую роль.
— Да, воистину реклама — двигатель торговли!
— Бог с ней, с торговлей. Меня огорчает во всем этом деле столь легкая возможность искажения истинной цены культуры. Как несправедливо получается, что в популярности человека искусства, произведения искусства самую последнюю роль играет мнение знатоков!
— Не забывайте, что такой вывод верен только в том случае, если реклама находится в нечестных руках. Если же знатоки будут влиять на то, чтобы объем рекламы был пропорционален заслугам, то все будет на своем месте!
— Это верно, — вздохнул мой собеседник, — но как этого у нас добиться?

История про четырёх котят

Если у вашей кошки родилось четверо котят, то никто не сомневается что вероятность того что все они одного пола минимальна. При этом считают, что наиболее вероятно рождение одинакового числа мальчиков и девочек. Так ли это?
Некоторые ухитряются определить пол по наглой морде...
Хотя количество вариантов достаточно велико: $2^4=16$, для наглядности мы выпишем их всех.
Все 16 вариантов
Рассматривая варианты видно, что рождение котят одного пола (серый фон) возможно только в 2-х случаях, что даёт вероятность $\frac{2}{16}=\frac{1}{8}$. Если подсчитать варианты с одинаковым количеством мальчиков и девочек, то их окажется 6, то есть вероятность этого события $\frac{6}{16}=\frac{3}{8}$ и она заметна. Тем не менее, если подсчитать количество вариантов с тремя котятами одного пола, их окажется восемь!, то есть вероятность именно такого варианта равна $\frac{8}{16}=\frac{1}{2}$ и именно она оказывается наибольшей!
Для многих людей, которые никогда не задумывались точным подсчётом вероятностей, вариант $3+1$ оказывается полной неожиданностью. На самом деле задачи такого типа решаются напрямую, но для этого надо хорошо знать соответствующую область математики — комбинаторику. Просто при небольшом количестве вариантов полный перебор вариантов оказывается нагляднее.

Среднее число детей

Однажды в городской газете опубликовали фотографию лучшей многодетной семьи. У них было тринадцать детей. Редактору газеты так понравилась фотография, что он вызвал фотографа и попросил сделать фото типичной семьи, у которой количество детей — среднее по городу. Но ничего не вышло. Почему?
Когда мы употребляем слово среднее, обычно подразумевается среднее арифметическое как точное значение. В нашем городе среднее количество детей в семье оказалось равным двум с половиной, то есть не просто не целым, но и числом, которое в житейском смысле нельзя обоснованно ни округлить ни вниз до 2-х, ни вверх до 3-х. Поэтому фотограф так и не смог выполнить задание.

Совпадение дней рождения

Предположим, вы работаете в офисе, где трудятся 23 работника, включая вас. Какова вероятность того, что у двоих сотрудников в офисе совпадут дни рождения (кроме 29 февраля)?
Данная задача имеет ответ – примерно 50 процентов. Однако попытка решить эту задачу напрямую не позволит даже определить, с чего собственно начать рассуждение. Но стоит её переформулировать через противоположную: не у двух человек в группе совпадут дни рождения, как появляется возможность сформировать рассуждение. Итак, приняв год за 365 дней и тот факт, что дни рождения разных людей независимы друг от друга, что можно сказать про то, что дни рождения НЕ совпадут у двух человек? У первого день рождения может быть в любой из доступных 365-ти дней, тогда для несовпадения достаточно чтобы день рождения у второго приходился на любой из оставшихся 364 дней, или в математической записи
$\large\frac{365}{365}\times\frac{364}{365}\approx 0.99726~.$
Если добавить третьего человека так, чтобы его день рождения не совпадал с первыми двумя, то для этого останется уже только 363 дня и
$\large\frac{365}{365}\times\frac{364}{365}\times\frac{363}{365}\approx 0.9917958~.$
Продолжая вычисление для 23-х человек получим
$\large\frac{365}{365}\times\frac{364}{365}\times\frac{363}{365}\times\ldots\times\times\frac{344}{365}\times\frac{343}{365}\approx 0.4927~.$
Так как сейчас мы вычисляли вероятность события обратного интересующему нас, то вероятность СОВПАДЕНИЯ 23-х дней рождений равна $(1 - 0.4927)\cdot 100\% = 50.73\%$
Необходимо напомнить, что слово вероятность означает возможность, поэтому взяв несколько коллективов из 23-х человек, мы можем и не обнаружить совпадений, но чем больше таких групп мы проанализируем, тем больше совпадений найдём; и отношение найденных к общему количеству рассмотренных будет стремиться к нашей теоретической оценке.

Нам нужны мальчики!

Правитель страны из чисто военных соображений хотел бы, чтобы среди его подданных было больше мальчиков, чем девочек. Поэтому он повелел, чтобы ни в одной семье не было более одной девочки. В результате у каждой женщины этой страны среди детей последней — и только последней — была девочка, ибо ни одна женщина, родив девочку, не решалась больше иметь детей. Какую же долю составляли мальчики в общей массе детей этой страны?
Пусть N — число матерей, которые уже более не рожают. Сколько у них девочек? По одной у каждой, т. е. N. А сколько у них мальчиков? У половины из них вообще нет мальчиков, поскольку с вероятностью $\frac{1}{2}$ первый родившийся ребенок будет девочкой. У четвертой части матерей будет по одному мальчику, ибо $\frac{1}{4}=\frac{1}{2}\cdot\frac{1}{2}$ есть вероятность того, что первый ребенок будет мальчиком, а второй — девочкой. У восьмой части — по два мальчика (по сходной причине). У шестнадцатой части — по три мальчика, и т. д. Всего получается
Сумма последовательности с достаточно большим количеством элементов
мальчиков. Но известно, что
Одно из известных разложений в ряд
ибо этот ряд представляет собой производную суммы геометрической прогрессии. Полагая x= 1/2, найдём что сумма в квадратных скобках равна
Формальная сумма бесконечной последовательности
откуда следует, что число мальчиков равно $4\cdot\frac{N}{4}$, или равно числу девочек. Таким образом, доля мальчиков в общем числе детей составляет ровно $\frac{1}{2}$ и ничуть не возросла несмотря на королевский указ.
Хороший пример ситуации когда «логичное» действие не даст желаемого результата. Даже более того, приведённое решение для удобства доказательства оперирует бесконечными суммами, а это не так, так как число родивших женщин N конечно. Из-за этого величина реальной суммы будет немного, но меньше полученной оценки, то есть число мальчиков не превышает N и их доля в общем числе детей чуть меньше половины. Повелитель страны явно перехитрил сам себя.

Комментарии