заданной высоты.
При этом мы ничего пока не будем говорить о масле. Но обещаю, что ему будет посвящен отдельный разговор, где мы подробно рассмотрим его роль в этом законе.
Как правильно говорить о случайных величинах
Метод Монте-Карло подразумевает, что в качестве параметров используются случайные переменные. И здесь наконец пора разобраться с тем, что же такое случайная величина.
Вернемся к математическим структурам. Какой структурой можно моделировать результаты выпадения числа на игральной кости или уровень воды в реке, ведь там постоянное волнение? Как работать с числом автомобилей, проезжающих перекресток в течение часа? Какой структурой можно описать состояние электрона в атоме водорода? С одной стороны, это конкретные числа из вполне определенного множества значений: для кости, например, из множества {1, 2, 3, 4, 5, 6}, — и какое-нибудь значение легко получить, проведя эксперимент. Однако повторный опыт даст иной результат — это явно не просто число: сегодня оно одно, завтра другое. Может даже возникнуть философский вопрос: а имеет ли смысл говорить о каком-то точном значении «уровня воды в реке» или числе автомобилей, ведь эти величины невозможно «поймать» и зафиксировать? Возможно ли в каком-либо смысле точное знание о случайной переменной?
Часто, говоря о таких случайных величинах, ограничиваются одним средним значением, и мы говорим о «средней скорости в час пик» или об «орбите электрона». Но это отличный способ запутаться или даже намеренно запутать. Если фраза «средняя скорость в час пик равна 15 км/ч» дает неплохое представление о ситуации на улице в целом, то переучивать студентов-физиков от мышления орбитами к оперированию волновыми функциями уже весьма непросто. Ну и, наконец, какой смысл в среднем значении числа, выпадающего на игральной кости? Посчитать-то его можно, любой с этим справится: (1 + 2 + 3 + 4 + 5 + 6) / 2 = 3,5. Но это число не говорит ровным счетом ничего о рассматриваемой случайной величине. Его даже нет на гранях кубика.
Может быть, нужно указать два числа: среднее и дисперсию? Это уже лучше, но опять же пример с игральной костью показывает, что это явно не вся информация об интересующем нас объекте. А что, если случайные величины — не числа, а множества? Скажем, уровень воды в реке можно попытаться описать интервалом возможных значений с учетом волнения, а для примера с машинами сказать, что за час проезжает от 1 до 100 автомобилей и т. д. Но легко увидеть, что и множества возможных значений тоже недостаточно: например, при многократном повторении измерения количества автомобилей на улице какие-то числа будут встречаться чаще, а каких-то мы не дождемся вовсе.
В предыдущей главе, определяя вероятность, мы ввели меру как функцию на вероятностном пространстве. Для случайной величины элементарными событиями этого пространства будут элементы области ее определения, а мерой задается распределение вероятностей для этой величины. И вот это уже исчерпывающая и точная информация. Итак, подводим итог: случайная величина однозначно и полностью характеризуется своим распределением. Распределение, в свою очередь, представляет собой функцию. Ее область определения — множество возможных значений случайной величины, а область значений этой функции — вероятности для этих значений.
Для уровня воды в реке или скорости машин распределение может быть выражено в виде гладкой колоколообразной кривой. Количество машин, зафиксированных на дороге в единицу времени, должно быть натуральным числом, и его распределение можно представить в виде дискретной функции, определенной только на натуральных числах, или точной формулы. Наконец, моделью игральной кости может быть таблица, показывающая вероятность выпадения каждого из возможных чисел (рис. 3.2).
Рис. 3.2. Примеры представления распределений различных случайных величин
Функции можно представлять аналитически или в виде приближения другой функцией, таблицы, гистограммы либо графика. Все эти представления — модели одного и того же объекта, случайной величины. Самое важное тут — не столько конкретный вид представления, сколько математические свойства этой функции. Для распределений вероятностей свойства бывают разными: количество параметров, количество мод, энтропия, бесконечная делимость, аддитивность, устойчивость, интегрируемость и т. д. Изучением распределений и их свойств занимается теория вероятностей. Но на практике часто встречается иная задача: необходимо найти модель для случайной величины, если мы не имеем полной информации о ней, но значения которой можем наблюдать, проводя эксперименты. Из огромного арсенала известных распределений с точно определенными свойствами исследователь выбирает не столько «самую похожую» функцию, сколько функцию, наиболее совпадающую по свойствам с наблюдаемой случайной величиной. Это составляет суть статистического анализа, который знаком каждому студенту, прикоснувшемуся к математической статистике.
Сейчас нам нужно задать параметры бутерброда случайными числами, не имея статистических данных, а руководствуясь лишь нужными нам свойствами этих величин. Это важная и интересная часть метода Монте-Карло, от которой зависят и решение, и его корректность.
Размеры бутерброда. Какими они могут быть? Разумной величины канапе имеет сантиметра три в ширину, а студенческий добрый «лапоть» может быть сантиметров пятнадцать. При этом вероятность встретить бутерброд миллиметровой или метровой ширины в практическом смысле равна нулю. Больше про бутерброды я ничего сказать не могу и приму их размеры равномерно распределенными в указанном диапазоне (рис. 3.3). Запишем это так:
l ~ Uniform([3,15]).
Рис. 3.3. Возможное распределение для размеров падающего бутерброда
В случае равномерного распределения на некотором отрезке [a,b] случайная величина имеет всюду одинаковую плотность, равную 1/(b — a). В этом случае плотность распределения принимает вид прямоугольника, а вероятность попасть в какой-нибудь отрезок пропорциональна его длине. Такой выбор не идеален: всё же средние бутерброды мы встречаем чаще крошечных или гигантских. Но позже мы увидим, что это слабое место можно изящно обойти.
Начальное положение. Тут мы, не мудрствуя, зададим равномерное распределение для смещения бутерброда за край стола, лишь бы он вообще упал:
dl ~ Uniform([l/2,l]).
Коэффициент трения. Это неотрицательная безразмерная величина, зависящая только от материала. Столы и скатерти бывают разные, пальцы сжимают бутерброд с разной силой. Диапазон коэффициента от 0,01 до 0,9, при этом крайние значения маловероятны, в среднем можно ожидать около 0,3. Для моделирования неизвестного коэффициента трения нам