Что это и что показывает
Нормальное распределение (колоколообразная кривая Гаусса) описывает множество природных величин: рост, ошибки измерений, суммы многих случайных факторов. Расчёт «вероятности по нормальному распределению» отвечает на вопрос: какова доля значений, попадающих ниже заданного порога x (или между двумя порогами)? Геометрически это площадь под кривой.
Формула и откуда она
Вероятность «значение меньше x» — это функция распределения (CDF), обозначаемая Φ для стандартного случая:
P(X < x) = Φ((x − μ) / σ)
Здесь μ — среднее, σ — СКО. Выражение (x − μ)/σ — это уже знакомая z-оценка: мы стандартизируем порог, переводя любое нормальное распределение к единому стандартному N(0, 1). Φ(z) — площадь под стандартной кривой слева от z; её значения берут из таблицы или калькулятора, поскольку интеграл не выражается через элементарные функции.
Полезный ориентир — правило 68–95–99.7: примерно 68% значений лежат в пределах ±1σ от среднего, 95% — в пределах ±2σ, 99.7% — в пределах ±3σ.
Как посчитать вручную (по шагам)
- Стандартизируйте порог: z = (x − μ) / σ.
- Найдите Φ(z) по таблице нормального распределения — это P(X < x).
- Для «больше x» возьмите 1 − Φ(z).
- Для интервала [a, b]: Φ((b−μ)/σ) − Φ((a−μ)/σ).
- Если нужна быстрая прикидка для целых σ — примените правило 68–95–99.7.
Разбор примера
IQ распределён нормально с μ = 100 и σ = 15. Какова вероятность встретить человека с IQ меньше 130?
Стандартизация: z = (130 − 100) / 15 = 30 / 15 = 2.
CDF: P(X < 130) = Φ(2) ≈ 0.9772, то есть около 97.7%.
Проверка правилом 68–95–99.7: 130 — это μ + 2σ. В пределах ±2σ лежит 95%, значит за пределами — 5%, поровну по хвостам — 2.5% сверху. Тогда ниже 130: 100% − 2.5% = 97.5% — совпадает с 97.72% (точное значение чуть выше из-за округления правила).
Где применяется / интерпретация
Используется в контроле качества (доля деталей в допуске), психометрии (IQ, тесты), финансах (оценка риска), биологии. Площадь = вероятность = доля популяции. Важно помнить: модель нормальна лишь приблизительно — реальные данные могут иметь скос или более тяжёлые хвосты, и тогда крайние вероятности (события «3+ сигмы») оцениваются особенно неточно.
Частые ошибки
- Забывают, что Φ даёт вероятность «меньше x»; для «больше» нужно 1 − Φ(z).
- Применяют нормальную модель к явно ненормальным данным (доходы, время ожидания — обычно скошены).
- Путают σ и σ² при стандартизации.
- Округляют правило 68–95–99.7 и принимают приближение за точное значение.
- При расчёте интервала вычитают площади «не в том порядке», получая отрицательную вероятность.