Меню

Уровнем значимости называется вероятность совершить ошибку первого рода тест



Ошибки первого и второго рода: расчет вероятности ошибки первого и второго рода

Проверка статистической гипотезы означает проверку согласования исходных выборочных данных с выдвинутой основной гипотезой. При этом возможно возникновение двух ситуаций – основная гипотеза может подтвердиться, а может и быть опровергнута. Следовательно, при проверке статистических гипотез существует вероятность допустить ошибку, приняв или опровергнув верную гипотезу.

При проверке статистических гипотез можно допустить ошибки первого или второго рода

Ошибкой первого рода – отвергаем верную гипотезу.

Ошибкой второго рода– не отвергаем неверную гипотезу.

Уровнем значимости α называется вероятность совершения ошибки первого рода.

Значение уровня значимости α обычно задаётся близким к нулю (например, 0,05; 0,01;0,02 и т. д.), потому что чем меньше значение уровня значимости, тем меньше вероятность совершения ошибки первого рода, состоящую в опровержении верной гипотезы Н0.

Вероятность совершения ошибки второго рода, т. е. принятия ложной гипотезы, обозначается β

При проверке нулевой гипотезы Н0 возможно возникновение следующих ситуаций:

N. B.! Смотрим распределение вероятностей по распределению верной гипотезы, то есть ошибку второго ищем по Н1, а не по Н0.

1- β – мощность критерия – способность теста обнаруживать альтернативную гипотезу или способность отвергать Н0, когда верна альтернатива (показывает насколько хороша статистика).

Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.

При проверке гипотез возникают ошибки двух типов. Ошибка первого рода — отвергнуть Н , в то время, как она является верной; и ошибка второго рода – принять нулевую гипотезу, которая в действительности является неверной. Вероятность ошибки первого рода называется уровнем значимости и обозначается α. Таким образом, α = Р<U Ψ | H>, т.е уровень значимости α – это вероятность события<U Ψ>, вычисленная в предположении о том, что Н верна. Наиболее часто уровень значимости принимают равным 0.05 или 0.01. Если, например, принят уровень значимости, равный 0.05, то это означает, что в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу).

Уровень значимости ошибки однозначно определен, если гипотеза простая (Н : р=1/4 , Н1 : р 1/4), то есть распределение вероятностей задано точно. Когда же гипотеза сложная, то есть задан тип распределения вероятности с точностью до параметра (Н : р=1/4, Н1: р 1/4, Н1: р 1/4, Н1 0,8)

Для проверки как нулевой так и альтернативной гипотезы используется специально подобранная величина, значение которой точно или приближенно известно, соответственно Z – нормальное распределение, F – Фишер, t – Стьюдент, 2 – «хи-квадрат». После выбора определенного критерия множество всех его возможных значений разделяют на два непересекающихся подмножества: то, где гипотеза принимается, и то, где нет.

Вероятность ошибки второго рода есть P<U Ψ | H1>. Обычно используют не эту вероятность, а а ее дополнение 1, т.е. P<U Ψ | H1> = 1 — P<U Ψ | H1>. Эта величина носит название мощности критерия. Таким образом, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная верна. Чаще всего мощность критерия обозначается как (1- ), где – ошибка второго рода. Стоит отметить, что мощность критерия – достаточно слабая статистика, потому что ошибки в ней слишком часты.

Читайте также:  Централизованное тестирование математика полный сборник тестов

Поскольку исследователь хочет прийти к правильному выводу, надежные исследования планируются таким образом, чтобы обеспечить низкий уровень а и большую мощность. При низком уровне а крайне мало шансов отвергнуть правильную нулевую гипотезу, а при большой мощности критерия больше шансов принять правильную альтернативную гипотезу.

Существует несколько способов увеличить мощность критерия:

· Повысить уровень значимомсти. Так повышается вероятность отвергнуть нулевую гипотезу и, соответственно, принять верную альтернативную. Вместе с тем растет риск отвергнуть же нулевую гипотезу, которая может оказаться верной, и совершить таким образом ошибку первого рода.

· Формулирование направленных гипотез – исследователь может сосредоточиться на риске с уровнем исходов, которые соответствуют выбранной гипотезе.

· Увеличить размер выборки, т.к статистики, основанные на большом количестве респондентов, более устойчивы и обеспечивают более точную оценку характеристик генеральной совокупности. Т.е прибавка прямым образом повышает вероятность того, что будет принята верная гипотеза.

Источник

Ошибки первого и второго рода. Уровень значимости

Статистическая проверка гипотез.

Лекция 7.

Классификация статистических гипотез:

Статистическойназывается гипотеза о неизвестном законе распределения случайной величины или о параметрах закона распределения, вид которого известен.

• В первом случае гипотеза называется непараметрической, во втором – параметрической.

Нулевой (основной)гипотезой называется выдвинутая гипотеза Н0.

Конкурирующей (альтернативной)гипотезой называется гипотеза Н1, которая противоречит нулевой гипотезе Н0.

• Различают простые и сложные гипотезы. Гипотеза называется простой, если она состоит в равенстве одного или нескольких параметров заданным числам. Если множество допустимых, для справедливости гипотезы, значений параметров состоит более, чем из одного элемента, то ее называют сложной.

Ошибка первого рода– отвергнуть гипотезу Н0 при её правильности. Вероятность этой ошибки называют уровнем значимости проверки гипотезы, и обычно обозначают α.

Ошибка второго рода– принятие ложной гипотезы Н0 при правильности альтернативной гипотезы Н1. Вероятность этой ошибки обычно обозначают β, а величину 1− β называют мощностью критерия.

Рассматриваемые случаи можно проиллюстрировать таблицей:

Гипотеза Н Отвергается Принимается
Верна Ошибка 1-го рода Правильное решение
Неверна Правильное решение Ошибка 2-го рода

Статистический критерий проверки нулевой гипотезы:

Общую схему проверки статистических гипотез кратко сформулировать непросто. Но можно выделить в ней следующие моменты:

Во-первых, формулируют нулевую гипотезу. Ее обычно обозначают Н0.

Одновременно рассматривается альтернативная или конкурирующая гипотеза, ее обычно обозначают Н1. Различают односторонние и двухсторонние конкурирующие гипотезы. Выбор вида альтернативной гипотезы определяется смыслом задачи.

Всегда имеется некоторая величина К, которую называют статистическим критерием или просто критерием проверки гипотезы – это случайная величина с известным распределением. Эту величину обозначают Z, если она распределена нормально, F – по закону Фишера-Снедекора, Т – по распределению Стьюдента.

Из данных конкретной выборки находится наблюдаемое значение Кнабл, и если оно плохо соответствует теоретическому распределению К, то отсюда делается вывод, что в действительности СВ К имеет другое распределение, а значит, и нулевая гипотеза H0 не верна. Она отклоняется, и принимается альтернативная гипотеза H0 .

Читайте также:  Артериальное давление зависит тест только от частоты сокращений сердца

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

Источник

Основы математической статистики — тест 2

Упражнение 1: Номер 1
Ответ:

Номер 2
Ответ:

Номер 3
Ответ:

Упражнение 2: Номер 1
Ответ:

Номер 2
Ответ:

Номер 3
Ответ:

Упражнение 3: Номер 1
Ответ:

Номер 2
Ответ:

Номер 3
Ответ:

Упражнение 4: Номер 1
Ответ:

Номер 2
Ответ:

&nbsp(1) распределение статистик этих критериев при справедливости math&nbsp
&nbsp(2) распределение статистик этих критериев при справедливости math&nbsp

Номер 3
Ответ:

Упражнение 5: Номер 1
Ответ:

&nbsp(1) math&nbsp
&nbsp(2) math&nbsp
&nbsp(3) math&nbsp

Номер 2
Ответ:

&nbsp(1) math&nbsp
&nbsp(2) math&nbsp
&nbsp(3) math&nbsp
&nbsp(4) math&nbsp

Номер 3
Ответ:

&nbsp(1) math&nbsp
&nbsp(2) math&nbsp
&nbsp(3) math&nbsp

Упражнение 6: Номер 1
Ответ:

&nbsp(1) math&nbsp
&nbsp(2) math&nbsp
&nbsp(3) math&nbsp
&nbsp(4) math&nbsp

Номер 2
Ответ:

&nbsp(1) math&nbsp
&nbsp(2) math&nbsp
&nbsp(3) math&nbsp
&nbsp(4) math&nbsp

Номер 3
Ответ:

&nbsp(1) math&nbsp
&nbsp(2) math&nbsp
&nbsp(3) math&nbsp

Источник

Типы ошибок при проверке гипотез (ошибки первого и второго рода). Уровни статистической значимости.

Ошибки первого рода (англ. type I errors, α errors, false positives) и ошибки второго рода (англ. type II errors, β errors, false negatives) в математической статистике — это ключевые понятия задач проверки статистических гипотез. Тем не менее, данные понятия часто используются и в других областях, когда речь идёт о принятии «бинарного» решения (да/нет) на основе некоего критерия (теста, проверки, измерения), который с некоторой вероятностью может давать ложный результат.

Из определения выше видно, что ошибки первого и второго рода являются взаимно-симметричными, то есть если поменять местами гипотезы <\displaystyle H_<0>> и <\displaystyle H_<1>> , то ошибки первого рода превратятся в ошибки второго рода и наоборот. Тем не менее, в большинстве практических ситуаций путаницы не происходит, поскольку принято считать, что нулевая гипотеза <\displaystyle H_<0>> соответствует состоянию «по умолчанию» (естественному, наиболее ожидаемому положению вещей) — например, что обследуемый человек здоров, или что проходящий через рамку металлодетектора пассажир не имеет запрещённых металлических предметов. Соответственно, альтернативная гипотеза <\displaystyle H_<1>> обозначает противоположную ситуацию, которая обычно трактуется как менее вероятная, неординарная, требующая какой-либо реакции.

С учётом этого ошибку первого рода часто называют ложной тревогой, ложным срабатыванием или ложноположительным срабатыванием — например, анализ крови показал наличие заболевания, хотя на самом деле человек здоров, или металлодетектор выдал сигнал тревоги, сработав на металлическую пряжку ремня. Слово «положительный» в данном случае не имеет отношения к желательности или нежелательности самого события.

Термин широко используется в медицине. Например, тесты, предназначенные для диагностики заболеваний, иногда дают положительный результат (то есть показывают наличие заболевания у пациента), когда на самом деле пациент этим заболеванием не страдает. Такой результат называется ложноположительным.

В других областях обычно используют словосочетания со схожим смыслом, например, «ложное срабатывание», «ложная тревога» и т. п. В информационных технологиях часто используют английский термин false positive без перевода.

Читайте также:  При контакте с больным herpes zoster ребенок может заболеть тест

Из-за возможности ложных срабатываний не удаётся полностью автоматизировать борьбу со многими видами угроз. Как правило, вероятность ложного срабатывания коррелирует с вероятностью пропуска события (ошибки второго рода). То есть: чем более чувствительна система, тем больше опасных событий она детектирует и, следовательно, предотвращает. Но при повышении чувствительности неизбежно вырастает и вероятность ложных срабатываний. Поэтому чересчур чувствительно (параноидально) настроенная система защиты может выродиться в свою противоположность и привести к тому, что побочный вред от неё будет превышать пользу.

Соответственно, ошибку второго рода иногда называют пропуском события или ложноотрицательным срабатыванием — человек болен, но анализ крови этого не показал, или у пассажира имеется холодное оружие, но рамка металлодетектора его не обнаружила (например, из-за того, что чувствительность рамки отрегулирована на обнаружение только очень массивных металлических предметов).

Слово «отрицательный» в данном случае не имеет отношения к желательности или нежелательности самого события.

Термин широко используется в медицине. Например, тесты, предназначенные для диагностики заболеваний, иногда дают отрицательный результат (то есть показывают отсутствие заболевания у пациента), когда на самом деле пациент страдает этим заболеванием. Такой результат называется ложноотрицательным.

В других областях обычно используют словосочетания со схожим смыслом, например, «пропуск события», и т. п.

Степень чувствительности системы защиты должна представлять собой компромисс между вероятностью ошибок первого и второго рода. Где именно находится точка баланса, зависит от оценки рисков обоих видов ошибок.

Вероятности ошибок(уровень значимостии мощность. Вероятность ошибки первого рода при проверке статистических гипотез называют уровнем значимости и обычно обозначают греческой буквой <\displaystyle \alpha > (отсюда название <\displaystyle \alpha > -errors).

Вероятность ошибки второго рода не имеет какого-то особого общепринятого названия, на письме обозначается греческой буквой <\displaystyle \beta > (отсюда <\displaystyle \beta > -errors). Однако с этой величиной тесно связана другая, имеющая большое статистическое значение — мощность критерия. Она вычисляется по формуле <\displaystyle (1-\beta )> . Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.

Обе эти характеристики обычно вычисляются с помощью так называемой функции мощности критерия. В частности, вероятность ошибки первого рода есть функция мощности, вычисленная при нулевой гипотезе. Для критериев, основанных на выборке фиксированного объема, вероятность ошибки второго рода есть единица минус функция мощности, вычисленная в предположении, что распределение наблюдений соответствует альтернативной гипотезе. Для последовательных критериев это также верно, если критерий останавливается с вероятностью единица (при данном распределении из альтернативы).

В статистических тестах обычно приходится идти на компромисс между приемлемым уровнем ошибок первого и второго рода. Зачастую для принятия решения используется пороговое значение, которое может варьироваться с целью сделать тест более строгим или, наоборот, более мягким. Этим пороговым значением является уровень значимости, которым задаются при проверке статистических гипотез. Например, в случае металлодетектора повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная тревога), а понижение чувствительности — к увеличению риска ошибки второго рода (пропуск запрещённого предмета).

Источник