Кривая гауссова распределения показывает, на что надо, а на что не надо обращать внимания, когда речь идет о случайной величине. Физические измерения, как и математический анализ, показывают, что отклонения, не превышающие четырехкратного значения среднего отклонения, являются нормой и поэтому не заслуживают ни особого внимания, ни объяснения. Скажем, известно, что физики могут измерять расстояния между атомами с точностью до 0,01 ангстрема. Некто Иванов публично заявил, что его измерения на 0,03 ангстрема отличаются от ранее полученных результатов, и пытается доказать, что его результат лучше имеющегося. Не стоило ему так поступать: не спорить ему надо, а сообщить ученому миру, что он лишь подтвердил ранее достигнутый физиками результат. Вот если бы его измерения отличались на 0,06 ангстрема, тогда другое дело; тогда можно было бы говорить, что какая-то из двух величин неверна и некто Петров был бы прав с точки зрения научной этики, приступив к измерению того же межатомного расстояния третий раз.
Зная гауссовы кривые для разных случайных событий, статистики отвергнут газетное сообщение о новорожденном весом в 6 килограммов, о том, что в городе Киеве 12-го числа рождались только мальчики, а 13-го только девочки, о том, что в Москве в мае месяце не было ни одного дня с температурой ниже 30 градусов, о том, что число автомобильных катастроф в декабре было в десять раз больше, чем в январе, что во вторник по всему городу не было продано ни одного куска мыла, а в среду никто не приобрел в аптеке таблеток пирамидона и т.д.
И право же, такой скептицизм, базирующийся на хорошей статистике и знании закона вероятности, обоснован не хуже, чем расчеты траектории космического корабля. Словом, невероятно – не факт.
Если вероятности невелики…
Во время войны довольно часто стреляли из винтовок по вражеским самолетам. Может показаться, что это безнадежное дело; о прицельной стрельбе здесь и речи быть не может, поскольку лишь пули, пробивающие бензобак или поражающие летчика, приносят результат. Было установлено, что вероятность удачного выстрела равнялась 0,001. Действительно мало. Но если стреляет одновременно много бойцов, то картина меняется.
Примеров, в которых нас интересует вероятность многократно осуществленного события, обладающего малой вероятностью, множество. Например, с задачей попадания в самолет из винтовки полностью совпадает задача о выигрыше в лотерею по нескольким билетам.
Каждая серия «выстрелов» может быть как неудачной, так и закончиться одной удачей, а то и несколькими. Соответствующее распределение вероятностей было найдено французским математиком Пуассоном.
В любом математическом справочнике вы найдете формулу Пуассона, а также таблицы, позволяющие найти интересующую вас вероятность без расчета.
Средняя частота – это результат, идеально совпавший с предсказанием теории вероятностей. Если вероятность выигрыша равняется 0,01, то из ста билетов выиграет 1, а из тысячи – 10. Единица и десять это и есть средние частоты выигрыша для серий в сто и тысячу билетов. Конечно, средняя частота может быть и дробным числом. Так, для серий в десять билетов при том же значении вероятности средняя частота выигрыша равняется 0,1. Это значит, что в среднем одна из десяти серий по десяти билетов будет содержать один выигрыш.
В таблицах Пуассона приводятся цифровые данные для всевозможных значений средних частот. Чтобы было ясно, в каком виде нам сообщаются эти сведения и для общей ориентировки приведем несколько чисел характеризующих распределение вероятности при средней частоте, равной единице. Вот эти числа.
Ста выстрелами при вероятности попадания в 0,01 или тысячью выстрелами при вероятности попадания в 0,001, или миллионом при вероятности в 0,000001, мы поразим цель один раз в 37 процентах случая, 2 раза в 18 процентах, 3 раза в 6 процентах… 8 раз лишь в 0,001 процента. А промахнемся сколько раз? Промахов точно столько же, сколько одноразовых попаданий, то есть 37 процентов.
Приведенные проценты, как и любые числа вероятностей, работают точно лишь для очень большого числа серий. Если миллион людей приобрел лотерейные билеты, выигрывающие с вероятностью в 0,01, то 37 процентов из них не выиграют ни разу, а 37 процентов других лиц обязательно выиграют по одному билету и т.д. Если же мы заинтересуемся выигрышами только 100 человек, то должны считаться с вероятными отклонениями от среднего. В «среднем» 37 из них не выиграют ни разу. Отклонения здесь от «среднего» не превысят 6≈sqrt(37)[Примечание 1]. А с такими отклонениями, как мы уже знаем, следует считаться и помнить, что число неудачников будет находиться между 31 и 43. Конечно, не исключены и бо́льшие отклонения в обе стороны, но их вероятность совсем уж невелика.
Узнав из условий розыгрыша, что в среднем на сотню лотерейных билетов один выигрывает, владелец билетов будет считать себя несчастливым, если на его 100 билетов выигрыш не упадет ни разу. Если же ему не повезет несколько раз, то он, возможно, заподозрит устроителей лотереи в несправедливости. Однако сделаем простой расчет. Если вероятность одного «промаха» равна 0,37 (37%), то вероятность двух «непопаданий» равна квадрату этого числа (0,14), а трех – кубу (0,05). А это не такие уж малые доли, чтобы делать столь решительные выводы.
Мой знакомый – американский математик мистер В., ранее занимавшийся достаточно успешно приложениями теории вероятностей к вопросам структуры жидкостей, переменил область своей деятельности.
– Я занимаюсь теорией рекламы, – сообщил он мне при последней нашей встрече.
– И это интересно?
– Бесспорно. Здесь много занятных тонкостей.
– А, собственно говоря, что же является конечной целью теории?
– Хотя бы получение ответа на вопрос, который интересует любого нашего промышленника: сколько денег имеет смысл потратить на рекламу?
– Но каковы же математические методы, которые вы используете?
– Да все те же, с которыми я имел дело до сих пор. Теория рекламы, теория популярности актера, теория известности писателя, прогноз бестселлеров литературы – все это классический предмет теории вероятностей. Не я один, а много моих коллег заняты этим приложением теории вероятностей к проблемам нашей капиталистической действительности.
– Может быть, вы расскажете мне о наиболее интересных теоретических находках в этой области?
– С удовольствием. Надеюсь, мне не надо доказывать вам, что, прежде чем добиться того, чтобы вещь, или событие, или некая персона понравились, надо, чтобы они стали известными потребителю?
– Без сомнения.
– Поэтому не будем пока касаться проблемы «нравится», а остановимся на вероятности получения неким гражданином сведений о существовании сигарет Честерфилд, лезвий для бритья фирмы Вильсон, романа Агаты Кристи «Убийство по азбуке» или киноактрисы Бетти Симпсон. Мы оставим в стороне систематические знания, приобретаемые в результате обучения в школе или университете, и будем интересоваться лишь теми сведениями, которые люди приобретают «на ходу», не преследуя образовательных целей. На каждого из нас через разные каналы: радио, газеты, телевидение, болтовню с друзьями – обрушивается мощный поток информации, получаемой «по случаю». Фамилии актеров, названия книжных новинок, новых сортов сигарет, лезвий для бритья и многое другое мы узнаем большей частью случайно. В зависимости от размаха рекламы, от интереса, который общество проявляет к тому или иному «модному» предмету, имеется некоторая определенная вероятность о нем услышать. Эта вероятность более или менее одинакова для однородной группы населения – скажем, для жителей города, имеющих телевизоры и радиоприемники и выписывающих две-три наиболее распространенные газеты.
Разумеется, равная вероятность получить информацию вовсе не означает, что по истечении какого-либо срока все люди окажутся одинаково сведущими. Случайное получение информации очень похоже на лотерейный выигрыш. Действительно, среди тысячи обладателей по десяти лотерейных билетов окажутся лица, которые не выиграют ни разу, которые выиграют один раз, найдутся обладатели двух счастливых билетов, будут и такие везучие игроки, у которых выигрыши выпадут на три, четыре и более билетов. Так что…
– Вы хотите сказать, что вероятность «столкновения» с рекламой, вернее, не с рекламой, а с упоминанием о предмете или лице, известность которого обсуждается, подчиняется распределению Пуассона?
– Совершенно верно. Если, скажем, вероятность натолкнуться на соответствующую информацию в течение одного дня равна одной сотой, то через сто дней 37 процентов населения, так сказать, омываемого этим потоком информации, так и не столкнется с этой рекламой, другие 37 процентов встретятся с упоминанием о рекламируемом предмете 1 раз, 18 процентов – два раза, 6 процентов – три раза и т.д. Эти числа, как вы, конечно, помните, дает закон Пуассона.