Определение доверительного интервала

Что такое доверительный интервал?

Доверительный интервал в статистике относится к вероятности того, что параметр совокупности будет находиться между набором значений определенное количество раз.

Ключевые выводы

  • Доверительный интервал отображает вероятность того, что параметр окажется между парой значений около среднего.
  • Доверительные интервалы измеряют степень неопределенности или определенности метода выборки.
  • Чаще всего они строятся с использованием уровней достоверности 95% или 99%.

Понимание доверительного интервала

Доверительные интервалы измеряют степень неопределенности или определенности метода выборки. Они могут принимать любое количество пределов вероятности, наиболее распространенным из которых является доверительный уровень 95% или 99%. Доверительные интервалы определяются с использованием статистических методов, таких как t-критерий.

Статистики используют доверительные интервалы для измерения неопределенности переменной выборки. Например, исследователь случайным образом выбирает разные образцы из одной и той же совокупности и вычисляет доверительный интервал для каждой выборки, чтобы увидеть, как она может представлять истинное значение переменной совокупности. Все полученные наборы данных разные; некоторые интервалы включают параметр истинной популяции, а другие нет.

Доверительный интервал — это диапазон значений, ограниченных выше и ниже среднего статистического значения, которые, вероятно, будут содержать неизвестный параметр совокупности. Уровень достоверности относится к проценту вероятности или уверенности в том, что доверительный интервал будет содержать истинный параметр генеральной совокупности, когда вы многократно рисуете случайную выборку. Или, говоря на просторечии, «мы на 99% уверены (уровень уверенности) что большинство этих образцов (доверительные интервалы) содержат истинный параметр численности «.

Самое большое заблуждение относительно доверительных интервалов состоит в том, что они представляют собой процент данных из данной выборки, который попадает между верхней и нижней границами. Например, можно ошибочно интерпретировать вышеупомянутый 99% доверительный интервал от 70 до 78 дюймов как указывающий, что 99% данных в случайной выборке попадают между этими числами. Это неверно, хотя для такого определения существует отдельный метод статистического анализа. Это включает в себя определение среднего и стандартного отклонения выборки и нанесение этих цифр на колоколообразную кривую.

Уверенность интервал и уверенность уровень взаимосвязаны, но не совсем одинаковы.

Расчет доверительного интервала

Предположим, группа исследователей изучает рост баскетболистов средней школы. Исследователи выбирают случайную выборку из населения и устанавливают средний рост в 74 дюйма.

Среднее значение в 74 дюйма — это точечная оценка среднего населения. Точечная оценка сама по себе имеет ограниченную полезность, потому что она не выявляет неопределенности, связанной с оценкой; у вас нет четкого представления о том, насколько далеко это среднее значение выборки в 74 дюйма может быть от среднего значения генеральной совокупности. Чего не хватает, так это степени неопределенности в этом единственном образце.

Доверительные интервалы предоставляют больше информации, чем точечные оценки. Установив 95% доверительный интервал с использованием среднего и стандартного отклонения выборки и предположив нормальное распределение, представленное колоколообразной кривой, исследователи пришли к верхней и нижней границе, которая содержит истинное среднее значение в 95% случаев.

Предположим, что интервал составляет от 72 дюймов до 76 дюймов. Если исследователи возьмут 100 случайных выборок из популяции баскетболистов средней школы в целом, среднее значение должно быть от 72 до 76 дюймов в 95 из этих выборок.

Если исследователи хотят еще большей уверенности, они могут расширить интервал до 99% уверенности. Это неизменно приводит к более широкому диапазону, поскольку освобождает место для большего числа выборочных средних. Если они установят 99% доверительный интервал как от 70 до 78 дюймов, они могут ожидать, что 99 из 100 проанализированных образцов будут содержать среднее значение между этими числами.

С другой стороны, уровень достоверности 90% означает, что мы ожидаем, что 90% интервальных оценок будут включать параметр генеральной совокупности и т. Д.

Часто задаваемые вопросы

Что показывает доверительный интервал?

Доверительный интервал — это диапазон значений, ограниченных выше и ниже среднего статистического значения, которые, вероятно, будут содержать неизвестный параметр совокупности. Уровень достоверности относится к проценту вероятности или уверенности в том, что доверительный интервал будет содержать истинный параметр генеральной совокупности, когда вы многократно рисуете случайную выборку.

Как используются доверительные интервалы?

Статистики используют доверительные интервалы для измерения неопределенности переменной выборки. Например, исследователь случайным образом выбирает разные образцы из одной и той же совокупности и вычисляет доверительный интервал для каждой выборки, чтобы увидеть, как она может представлять истинное значение переменной совокупности. Все результирующие наборы данных различаются, где некоторые интервалы включают истинный параметр совокупности, а другие нет.

Что является распространенным заблуждением о доверительных интервалах?

Самое большое заблуждение относительно доверительных интервалов состоит в том, что они представляют собой процент данных из данной выборки, который попадает между верхней и нижней границами. Другими словами, было бы неправильно предполагать, что доверительный интервал 99% означает, что 99% данных в случайной выборке попадают между этими границами. На самом деле это означает, что можно быть уверенным на 99%, что диапазон будет содержать среднее значение генеральной совокупности.

Что такое Т-тест?

Доверительные интервалы определяются с использованием статистических методов, таких как t-критерий. T-критерий — это тип выводимой статистики, используемый для определения значительного различия между средними значениями двух групп, которые могут быть связаны по определенным характеристикам. Для расчета t-критерия требуются три ключевых значения данных. Они включают разницу между средними значениями из каждого набора данных (называемую средней разницей), стандартное отклонение каждой группы и количество значений данных в каждой группе.

Поделитесь с друзьями

Address
304 North Cardinal St.
Dorchester Center, MA 02124

Work Hours
Monday to Friday: 7AM - 7PM
Weekend: 10AM - 5PM