Что это и что показывает
Доверительный интервал (ДИ) для среднего — это диапазон вокруг выборочного среднего, в который, с заданной уверенностью, попадает истинное среднее всей совокупности. По одной выборке мы не знаем точное μ генеральной совокупности, но можем очертить правдоподобный «коридор». Уровень доверия (например, 95%) говорит, как часто такой метод накрывает истину при многократном повторении.
Формула и откуда она
CI = x̄ ± z · σ/√n
где x̄ — выборочное среднее, σ — стандартное отклонение совокупности, n — объём выборки, z — критическое значение для выбранного уровня доверия (для 95% z ≈ 1.96; для 90% — 1.645; для 99% — 2.576). Величина SE = σ/√n называется стандартной ошибкой среднего: она показывает, насколько колеблется выборочное среднее от выборки к выборке. Деление на √n отражает закон: чем больше выборка, тем точнее оценка — но точность растёт лишь как корень из n, а не линейно.
Как посчитать вручную (по шагам)
- Вычислите выборочное среднее
x̄. - Найдите стандартную ошибку: SE = σ / √n.
- Выберите уровень доверия и соответствующее z (95% → 1.96).
- Вычислите предел погрешности (margin): m = z · SE.
- Постройте интервал: нижняя граница = x̄ − m, верхняя = x̄ + m.
Разбор примера
Измерили n = 36 деталей, выборочное среднее x̄ = 50 мм, σ = 12 мм. Построим 95%-й ДИ.
Стандартная ошибка: SE = 12 / √36 = 12 / 6 = 2 мм.
Критическое z: для 95% z = 1.96.
Предел погрешности: m = 1.96 × 2 = 3.92 мм.
Интервал: 50 ± 3.92 → от 46.08 до 53.92 мм.
Толкование: мы на 95% уверены, что истинное среднее всех деталей лежит между 46.08 и 53.92 мм.
Где применяется / интерпретация
ДИ применяют в опросах («45% ± 3%»), клинических испытаниях, измерениях, A/B-тестах. Чем уже интервал — тем точнее оценка; сузить его можно, увеличив n или снизив уровень доверия. Корректная формулировка: интервал — про метод, а не про конкретное число. «95% ДИ» означает, что 95% таких интервалов, построенных по разным выборкам, накроют истинное μ. Если σ неизвестно и выборка мала, вместо z берут t-распределение Стьюдента.
Частые ошибки
- Говорят «вероятность 95%, что μ внутри этого интервала» — μ фиксировано, случаен интервал; правильнее про долю накрытий.
- Делят σ на
nвместо√n— это завышает точность. - Берут z вместо t при малой выборке и неизвестном σ.
- Путают σ совокупности с выборочным s, не отмечая это в выборе z/t.
- Считают, что более широкий интервал «хуже» — он честнее отражает неопределённость.