Галанов Ю.И.

 

Биномиальное распределение и его предельные формы

Методические указания и примерная программа проведения лабораторной работы (практического занятия) в среде MathCad по курсу “Теория вероятностей и математическая статистика”

 

1. Основные положения.

Пожалуй, самой распространенной вероятностной схемой, к которой сводится решение многих задач, является схема повторения независимых испытаний в неизменных условиях. Если в серии таких испытаний нас интересует только одно событие A, которое в каждом отдельном испытании может произойти с вероятностью p и не произойти с вероятностью q = 1 - p, то мы приходим к так называемой схеме Бернулли.

Любое случайное событие удобно описывать с помощью специальной случайной величины – индикатора события ( I ). Индикатор события – это такая случайная величина, которая принимает значение, равное единице, если событие произошло и значение, равное нулю, если событие не произошло.

Введем случайную величину x , принимающую значения m, равное числу появления события А в серии из n испытаний. Множество элементарных событий для данного опыта (серии из n испытаний) состоит из всевозможных событий вида

А i = { x = m i ; i = 1, 2, … , n; m = 0, 1, … }

m i = I i1 + I i2+…+ I i n,

где I i - индикатор i-го испытания.

Видно, что Аi можно рассматривать как последовательность, состоящую из m единиц и n – m нулей. Вероятность такого события равна произведению вероятностей появления события ровно m раз и его непоявления n – m раз:

.

Число элементарных событий { x = m } равно числу сочетаний из n элементов по m. Напомним, что число сочетаний из m элементов по n рассчитывается по формуле:

При больших n и m вычисления факториалов вычисляются приближенно по формуле Стирлинга ( 1730 г.):

(1*)

( при n = 10 относительная погрешность вычислений не превышает 0.83%).

Окончательно, вероятность того, что в серии из n испытаний событие произойдет ровно m раз будет равно:

P(mn=

(1)

Распределение случайной величины, задаваемое формулой (1) называется биномиальным. Свое название она получила, от того, что значения P( m, n) являются членами в разложении (p + q) n по формуле бинома Ньютона:

Поскольку p + q = 1, то

Эта формула просто иллюстрирует аксиому теории вероятностей, cогласно которой вероятность достоверного события равна единице. Действительно, события

составляют полную группу событий.

Исследуем характер зависимости P( m, n) как функции от m. Для этого рассмотрим отношение:

Тогда интервал ее возрастания (Q > 1) определится неравенством:

 ,

а интервал убывания (Q < 1) неравенством:

.

Положение максимума функции m* будет определяться соотношением:

.

(2)

Это значение называется наиболее вероятным. Расстояние между границами в (2) равно ровно единице, поэтому, если np – q дробное, то m* будет единственное, если (np – q) – целое, то наиболее вероятными будут два соседних значения: (np – q) и (np + p).

2. Числовые характеристики биномиального распределения.

2.1. Математическое ожидание и дисперсия.

По определению, математическое ожидание случайной величины вычисляется по формуле:

где

x i - значения случайной величины x ,

p i - вероятности событий .

Для закона распределения случайной величины (1) мы получим:

Поскольку

,

то

Окончательно:

Для дисперсии, по определению, имеем:

.

С учетом (1) получим:

2.2.Расчет числовых характеристик с помощью индикатора событий.

Аппарат индикаторов – чисто вероятностный метод – позволяет избежать громоздких формул суммирования.

Индикатор события I задается следующим законом распределения:

I i

0

1

p i

1-p

p

где I i - значения индикатора;

p i - вероятность события в отдельном испытании.

Математическое ожидание индикатора mI и дисперсия DI равны:

С помощью индикаторов отдельных испытаний Ii число появлений события А в схеме Бернулли выражается формулой:

(3)

Вычислим математические ожидания и дисперсии от обеих частей выражения (3):

3.Поведение при больших m и n.

3.1.Постановка задачи.

При больших m и n вычисления по формуле (1) становится затруднительным, так как, с одной стороны, факториалы больших чисел очень велики и возникает опасность переполнения разрядной сетки компьютера, с другой стороны, возведение в высокую степень чисел, меньше единицы ( p и q < 1) грозит потерей числа ( числа могут стать меньше машинного нуля). Использование формулы Стирлинга (1*) не снимает указанные выше вычислительные проблемы.

Очевидно, что возникающие при этом неопределенности вида следует устранять путем исследования предельного перехода в формуле (1) при

.

Решение данной задачи связано с именами А.Муавра (1730 г.), П.Лапласа ( 1812 г.) и С. Пуассона (1837 г.).

В зависимости от предельного поведения вероятности события p, математического ожидания и дисперсии случайных величин, различают, в основном, два предельных распределения.

3.2."Нормальное" приближение.

3.2.1.Локальная теорема Муавра - Лапласа.

Рассмотрим случай, когда n и np велики, т.е.

.

Конечно, P( m, n) по-прежнему будет иметь пик вблизи математического ожидания m*= n*p . Используя формулу Стирлинга (1*) для факториалов, перепишем выражение для P( m, n) в следующем виде:

(4)

Введем новую переменную

,

которая равна отклонению m от своего математического ожидания. Полагая, что

,

разлагаем (4) в ряд Тейлора по степеням x и оставляя только главные члены, получим:

(5)

Тем самым мы доказали локальную предельную теорему Муавра:

 

Если вероятность наступления некоторого события в n независимых испытаниях постоянна и равна p, то вероятность P( m, n) того, что в этих испытаниях событие А наступит ровно m раз, удовлетворяет при соотношению (5).

 3.2.2. Интегральная теорема Муавра - Лапласа

При подсчете вероятности попадания случайной величины в заданный промежуток значений необходимо суммировать вероятности отдельных ее значений, принадлежащих заданному промежутку. В этом случае справедлива интегральная теорема Лапласа, которая утверждает, что

3.3. Приближение Пуассона

Второй предел биномиального распределения, представляющий практический интерес, относится к случаю, когда при неограниченном увеличении числа испытаний математическое ожидание остается постоянным:

Если при , то перейдя к противоположному событию, мы получим тот же случай. Полагая m << n, получим при

Следовательно,

Полученное распределение вероятностей случайной величины называется законом Пуассона.

Распределение Пуассона имеет максимум вблизи

( знак [x] обозначает целую часть числа x, меньшую или равную x ).

Числовые характеристики распределения:

математическое ожидание

дисперсия

4. Практическое использование распределений.

Рассмотренные предельные распределения интересны не только тем, что их использование облегчает расчеты вероятностей событий в схеме Бернулли, но и тем, что они описывают особые классы случайных величин, имеющих самостоятельное значение вне схемы Бернулли.

4.1. Нормальное распределение.

Нормальное распределение относится к числу наиболее распространенных и важных.

Оно часто используется для приближенного описания многих случайных явлений, когда интересующий нас результат складывается из большого количества независимых случайных факторов, среди которых нет сильно выделяющихся.

4.2. Распределение Пуассона.

Распределение Пуассона играет важную роль для описания "редких" событий в физике, теории связи, теории надежности, теории массового обслуживания и т.д. – там, где в течение определенного времени может происходить случайное число каких-то событий ( радиоактивных распадов, телефонных вызовов, отказов оборудования, несчастных случаев и т.п.).

 5. Задание к лабораторной работе (практическому занятию).

1. Задать функцию биномиального распределения и построить ее график.
2. Исследовать зависимость формы кривой и положения ее максимума от параметров n, p.
3. Задать функцию нормального (стандартного) распределения и построить ее график.
4. Представить на одном рисунке графики стандартного и биномиального распределений.
5. Оценить качество аппроксимации биномиального распределения нормальным.
6. Задать функцию распределения Пуассона и построить ее график.
7. Представить на одном рисунке графики Пуассоновского и биномиального распределений.
8. Оценить качество аппроксимации биномиального распределения распределением Пуассона.

 6. Примерная программа проведения работы в среде MathCad