Блог Science for you

Статистическая гипотеза

Статистическая гипотеза — это некоторое предположение о свойствах генеральной совокупности (частью которого мы с Вами являемся), которое необходимо проверить, т. е. является ли интересуемое/изучаемое/наблюдаемое явление случайным или результатом воздействия определенных факторов.

Для этого формулируют 2 гипотезы: нулевую (Н0) и альтернативную гипотезы (Н1).

H0 — предположение о свойствах генеральной совокупности, которое является логичным и правдоподобным, об отсутствии влияния/воздействия фактора, т. е. нулевая гипотеза, обладающая «презумпцией справедливости»: пока не доказано, что её утверждение ложно, она считается истинной.

H1 — утверждение о свойствах генеральной совокупности, которое принимается в случае, когда нет возможности принять нулевую гипотезу.

Препарат О. не снижает уровень артериального давления до показателей нормы — пример нулевой гипотезы.
Препарат О. снижает уровень артериального давления до показателей нормы — пример альтернативной.

Для принятия решения необходимо данные гипотезы проверить.

Общий алгоритм проверки гипотезы:
1. Формулировка гипотез: H0 и H1
2. Выбор исследователем уровня значимости: чаще всего это 0,001, 0,01, 0,05, при этом важно определить область принятия гипотезы критерия
3. Выбор статистического критерия — зависит от поставленных задач
4. Итоговое принятие решения на основе исходной выборки данных: нулевая гипотеза либо принимается, либо отвергается в пользу альтернативной

Эти 4 шага проверки гипотезы являются универсальными.


Нулевая гипотеза выдвигается на основе анализа ВЫБОРОЧНЫХ данных, поэтому невозможно на 100% утверждать ее истинность либо ложность даже после статистической проверки!

Как правило, проверяемые гипотезы сравнивают между собой группы наблюдений/пациентов, на которые воздействуют различные факторы.

Например, сравнивают частоту осложнений оперативного вмешательства разными методами 2 групп пациентов.

Нулевую гипотезу выражают как отсутствие эффекта (частота осложнений после проведенной разными методами хирургической операции одинаковая в двух группах); альтернативная гипотеза будет означать, что частота осложнений различается.


Возможно принять только одно из двух решений:
1. отвергнуть нулевую гипотезу и принять альтернативную гипотезу
2. принять нулевую гипотезу

При этом всегда можно ошибиться, отвергая/принимая нулевую гипотезу, потому что есть только выборочная информация.


Что это за ошибки?
Ошибка 1-го рода α (альфа): отвержение Н0 в то время, когда она истинна, на основании чего делается вывод, что различия есть, хотя на самом деле их нет.
Н0 отвергают, если расчетный показатель p< α (уровня значимости).
Максимальная вероятность допустить ошибку 1-го рода в медико-биологических исследованиях устанавливается на уровне 0,05, хотя возможно устанавливать на уровне 0,01, 0,001.
Ошибка 2-го рода β (бета): принимает Н0, когда она ложна, делая вывод, что различий нет, хотя на самом деле они есть.
В статистике чаще используют не само значение β, а величину (1-β)*100% - мощность исследования.

Минимальное значение мощности составляет 80%, т. е. мы готовы ошибиться на 20% в случае, если примем тот факт, что различий нет, хотя они в действительности есть.
Таким образом, мощность — это вероятность отклонить нулевую гипотезу, когда она ложна, т. е. это шанс выявить воздействие фактора/лечения/оперативного вмешательства в группе наблюдений как статистически значимое.

Конечно, каждый исследователь мечтает, чтобы мощность составляла 100%; однако это невозможно, так как всегда остается шанс, допустить ошибку 2-го рода.

Самая опасная ошибка — это ошибка 1 рода.

Разберем на примере:
При проведении исследования воздействия нового препарата (по снижению уровня АД) и отвергаем Н0, делаем вывод, что различия есть, т. е. новый препарат снижает АД, хотя на самом деле нет! И такой препарат вводят в оборот лекарственных средств. Вывод делайте сами.


Соотношение ошибок и принятия решения представлено на схеме:

Если у вас остались вопросы, я и моя команда поможем их решить. Записывайтесь на бесплатную консультацию здесь
Статистика
Made on
Tilda