Меню

С какой целью рассчитывается корреляционное отношение тест

С какой целью рассчитывается корреляционное отношение тест

Для измерения тесноты связи между двумя явлениями используется корреляционное отношение , предложенное Пирсоном. Его определяют по данным, сгруппированным по объясняющей переменной либо по корреляционной таблице. В обоих случаях вычисляют частные, или условные, средние зависимой переменной по каждой группе значений объясняющей переменной.

Процедуры вычислений корреляционного отношения и индекса корреляции очень схожи. Различие заключается лишь в том, что при вычислении корреляционного отношения исходят из частных средних, а не из соответствующих значений регрессии. Следовательно, оно не связано с определенной функцией регрессии. Чтобы связать эти два понятия, можно корреляционное отношение интерпретировать следующим образом. При его определении предполагаем, что мы исходим из такой функции регрессии, которой соответствует кривая, проходящая через все точки частных средних зависимой переменной. Введем обозначения (см. раздел 2.6): частота группы (интервала) значений объясняющей переменной — частное среднее переменной у для группы (интервала) значений объясняющей переменной значение зависимой переменной у в группе (интервале) значений объясняющей переменной

По аналогии с индексом корреляции определим теперь корреляционное отношение:

Используя разложение дисперсии на составляющие, представим корреляционное отношение по аналогии с коэффициентом парной детерминации следующим образом:

Здесь межгрупповая дисперсия, характеризующая рассеяние частных средних относительно общего среднего — среднее из частных дисперсий, служащее для характеристики среднего рассеяния значений переменной внутри групп. Из формул (7.9)-(7.11) видно, что корреляционное отношение вычисляется только по сгруппированному числовому материалу. При использовании любой из этих формул должна быть известна общая дисперсия Если в распоряжении имеются результаты группировок по объясняющей переменной с указанием только частных средних и нет доступа к исходному числовому материалу, то корреляционное отношение вычислить невозможно.

Если числовой материал представлен в виде корреляционной таблицы, то удобно для практических расчетов пользоваться формулами, полученными из (7.9) по аналогии с (6.10):

Здесь — середина интервала значений переменной — частота этого интервала, — условная частота интервала значений переменной у и интервала значений переменной х (частота, указанная в клетке корреляционной таблицы). Возможные значения корреляционного отношения заключены в интервале

Если т.е. частные средние совпадают со значениями переменной то Если т. е. все частные средние лежат на одной прямой, проведенной параллельно оси абсцисс на расстоянии у от нее, . В последнем случае говорят об отсутствии связи между переменными в том смысле, как ее понимают в корреляционном анализе.

На величину корреляционного отношения оказывает влияние произведенная группировка статистического материала. Чем больше выделено групп по объясняющей переменной, тем меньше значений зависимой переменной попадает в каждую группу, тем большему рассеянию подвержены частные средние относительно общего среднего, т. е. тем больше сказывается влияние неучтенных второстепенных факторов и случайностей. Следовательно, межгрупповая дисперсия частных средних с ростом числа групп, как правило, увеличивается, а общая дисперсия остается без изменения. В основном наблюдается такая тенденция: с ростом числа групп по объясняющей переменной корреляционное

(кликните для просмотра скана)

отношение увеличивается. При фиксированном количестве групп по объясняющей переменной корреляционное отношение зависит также от группировки значений зависимой переменной. Чаще всего корреляционное отношение тем больше, чем дифференцированнее группировка по зависимой переменной. Все это надо иметь в виду при использовании корреляционного отношения в качестве показателя тесноты связи.

Как уже отмечалось, при вычислении корреляционного отношения не ориентируются ни на какой вид функции регрессии. Поэтому по нему нельзя сделать никакого вывода о надежности оценки регрессии. Поскольку при вычислении корреляционного отношения исходят из частных средних, вполне очевидно, что Поэтому для измерения интенсивности зависимости переменной х от переменной у вычисляют корреляционное отношение, по формуле, которую легко получить из (7.12) или (7.13) подстановкой в них другой переменной.

Вычислим корреляционное отношение для зависимости объема производства от основных фондов (см. табл. 5 из раздела 2.6). В табл. 14 произведено вычисление выражения , используемого далее в (7.13). В результате имеем:

Полученное значение свидетельствует о тесной связи между объемом производства и основными фондами. Коэффициент корреляции Пирсона, вычисленный по тем же исходным данным, равен (см. раздел 4.2). Для нашего примера оба показателя незначительно отличаются друг от друга. Соотношения, существующие между обоими показателями, мы рассмотрим в следующем разделе.

Источник



Тестовые задания по теме с эталонами ответов.

1. ТЕРМИН «КОРРЕЛЯЦИЯ» В СТАТИСТИКЕ ПОНИМАЮТ КАК

1) связь, зависимость

2) отношение, соотношение

3) функцию, уравнение

Правильный ответ: 1

2. СВЯЗЬ МЕЖДУ ПРИЗНАКАМИ МОЖНО СЧИТАТЬ СРЕДНЕЙ ПРИ ЗНАЧЕНИИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Правильный ответ: 2

3. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ R = — 0,82 ГОВОРИТ О ТОМ, ЧТО КОРРЕЛЯЦИОННАЯ СВЯЗЬ

1) прямая, средней силы

2) обратная, слабая

3) прямая, сильная

4) обратная, сильная

Правильный ответ: 4

4. ПРИ ЗНАЧЕНИИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ В ДИАПАЗОНЕ ОТ 0 ДО 0,3 СИЛА СВЯЗИ ОЦЕНИВАЕТСЯ КАК

Правильный ответ: 1

5. СВЯЗЬ МЕЖДУ ПРИЗНАКАМИ МОЖНО СЧИТАТЬ СИЛЬНОЙ ПРИ ЗНАЧЕНИИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Правильный ответ: 3

6. ЗАВИСИМОСТЬ, ПРИ КОТОРОЙ УВЕЛИЧЕНИЕ ИЛИ УМЕНЬШЕНИЕ ЗНАЧЕНИЯ ОДНОГО ПРИЗНАКА ВЕДЕТ К УВЕЛИЧЕНИЮ ИЛИ УМЕНЬШЕНИЮ – ВТОРОГО, ХАРАКТЕРИЗУЕТ СЛЕДУЮЩИЙ ВИД СВЯЗИ

Правильный ответ: 1

7. ЗАВИСИМОСТЬ, ПРИ КОТОРОЙ УВЕЛИЧЕНИЕ ОДНОГО ПРИЗНАКА ДАЕТ УМЕНЬШЕНИЕ ВТОРОГО ХАРАКТЕРИЗУЕТ СЛЕДУЮЩИЙ ВИД КОРРЕЛЯЦИОННОЙ СВЯЗИ

Правильный ответ: 2

8. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА ОПРЕДЕЛЯЕТ

1) статистическую значимость различий между переменными

2) степень разнообразия признака в совокупности

3) силу и направление связи между зависимой и независимой переменными

4) долю дисперсии результативного признака объясняемую влиянием независимых переменных

Правильный ответ: 3

9. УСЛОВИЕМ ДЛЯ РАСЧЕТА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ПИРСОНА ЯВЛЯЕТСЯ

1) распределение переменных неизвестно

2) нормальное распределение по крайней мере, одной из двух переменных

3) по крайней мере, одна из двух переменных измеряется в ранговой шкале

4) отсутствует нормальное распределение переменных

Правильный ответ: 2

10. РАНГОВЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ СПИРМЭНА РАССЧИТЫВАЕТСЯ, КОГДА

1) присутствует нормальное распределение переменных

2) необходимо оценить связь между качественными и количественными признаками

3) необходимо определить статистическую значимость различий между переменными

4) необходимо оценить степень разнообразия признака в совокупности

Правильный ответ: 2

11. ЗАВИСИМОСТЬ, КОГДА КАЖДОМУ ЗНАЧЕНИЮ ОДНОГО ПРИЗНАКА СООТВЕТСТВУЕТ ТОЧНОЕ ЗНАЧЕНИЕ ДРУГОГО, НАЗЫВАЕТСЯ

Правильный ответ: 4

12. ЗАВИСИМОСТЬ, КОГДА ПРИ ИЗМЕНЕНИИ ВЕЛИЧИНЫ ОДНОГО ПРИЗНАКА ИЗМЕНЯЕТСЯ ТЕНДЕНЦИЯ (ХАРАКТЕР) РАСПРЕДЕЛЕНИЯ ЗНАЧЕНИЙ ДРУГОГО ПРИЗНАКА, НАЗЫВАЕТСЯ

Правильный ответ: 3

13. ДЛЯ ИЗОБРАЖЕНИЯ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ИСПОЛЬЗУЕТСЯ ГРАФИК

2) график рассеяния точек

Правильный ответ: 2

14. ЕСЛИ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ РАВЕН 1, ТО СВЯЗЬ ЯВЛЯЕТСЯ

1) сильной, прямой

2) сильной обратной

3) средней, прямой

4) полной (функциональной), прямой

Правильный ответ: 4

15. СВЯЗЬ МЕЖДУ Y ИX МОЖНО ПРИЗНАТЬ БОЛЕЕ СУЩЕСТВЕННОЙ ПРИ СЛЕДУЮЩЕМ ЗНАЧЕНИИ ЛИНЕЙНОГО КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Правильный ответ: 3

16. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ИСПОЛЬЗУЕТСЯ ДЛЯ ИЗУЧЕНИЯ

1) взаимосвязи явлений

2) развития явления во времени

3) структуры явлений

4) статистической значимости различий между явлениями

Правильный ответ: 1

17. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ МОЖЕТ ПРИНИМАТЬ ЗНАЧЕНИЯ

4) любые положительные

Правильный ответ: 3

18. КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ МОЖЕТ ПРИНИМАТЬ ЗНАЧЕНИЯ

4) любые положительные

Правильный ответ: 1

19. В РЕЗУЛЬТАТЕ ПРОВЕДЕНИЯ РЕГРЕССИОННОГО АНАЛИЗА ПОЛУЧАЮТ УРАВНЕНИЕ, ОПИСЫВАЮЩЕЕ . ПОКАЗАТЕЛЕЙ

Правильный ответ: 1

20. ЛИНЕЙНАЯ СВЯЗЬ МЕЖДУ ФАКТОРАМИ ИССЛЕДУЕТСЯ С ПОМОЩЬЮ УРАВНЕНИЯ РЕГРЕССИИ

1)

2)

3)

4)

Правильный ответ: 1

21. ПАРАМЕТР b (b= 0,016) ЛИНЕЙНОГО УРАВНЕНИЯ РЕГРЕССИИ ПОКАЗЫВАЕТ, ЧТО

Читайте также:  Логистическая цепь это тест

1) с увеличением признака «х» на 1 признак «у» увеличивается на 0,678

2) с увеличением признака «х» на 1 признак «у» увеличивается на 0,016

3) с увеличением признака «х» на 1 признак «у» уменьшается на 0,678

4) с увеличением признака «х» на 1 признак «у» уменьшается на 0,016

Правильный ответ: 2

22. НЕЗАВИСИМАЯ ПЕРЕМЕННАЯ В УРАВНЕНИИ РЕГРЕССИИ НАЗЫВАЕТСЯ

4) переменной отклика

Правильный ответ: 3

23. ЗАВИСИМАЯ ПЕРЕМЕННАЯ В УРАВНЕНИИ РЕГРЕССИИ НАЗЫВАЕТСЯ

4) переменной отклика

Правильный ответ: 4

24. ДЛЯ ПРОГНОЗИРОВАНИЯ ИЗМЕНЕНИЯ БИНАРНЫХ ПРИЗНАКОВ ПРИМЕНЯЕТСЯ СЛЕДУЮЩИЙ ВИД РЕГРЕССИИ

Правильный ответ: 4

25. ДЛЯ ОЦЕНКИ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ КАЧЕСТВЕННЫМИ ПРИЗНАКАМИ ПРИМЕНЯЕТСЯ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Правильный ответ: 2

26. ДОЛЮ ВАРИАЦИИ ПРИЗНАКА-РЕЗУЛЬТАТА, СЛОЖИВШУЮСЯ ПОД ВЛИЯНИЕМ НЕЗАВИСИМОГО ПРИЗНАКА ОБЪЯСНЯЕТ КОЭФФИЦИЕНТ

1) корреляции Пирсона

2) корреляции Спирмэна

Правильный ответ: 3

27. ДЛЯ ИЗУЧЕНИЯ СВЯЗИ, В КОТОРОЙ ПРИСУТСТВУЕТ БОЛЕЕ ОДНОЙ НЕЗАВИСИМОЙ ПЕРЕМЕННОЙ ИСПОЛЬЗУЕТСЯ

1) линейная регрессия

2) множественная регрессия

3) ранговая корреляция Спирмэна

4) расчет темпа прироста

Правильный ответ: 2

28. ДЛЯ РАСЧЕТА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ СПИРМЭНА НЕОБХОДИМО

1) расположить переменные в порядке возрастания

2) расположить переменные в порядке убывания

3) возвести переменные в квадрат

4) присвоить переменным в порядке возрастания последовательные ранги (номера 1, 2, 3, . n)

Правильный ответ: 4

29. ЗАВИСИМОСТЬ ВЕСА ОТ РОСТА ЧЕЛОВЕКА (РОСТО-ВЕСОВОЙ ИНДЕКС) ОПИСЫВАЕТСЯ ПРИ ПОМОЩИ

1) логистической регрессии

2) множественной регрессии

3) экспоненциальной регрессии

4) линейной регрессии

Правильный ответ: 4

30. ЗАВИСИМОСТЬ ПОЛОЖИТЕЛЬНОГО ИЛИ ОТРИЦАТЕЛЬНОГО РЕЗУЛЬТАТА ЛЕЧЕНИЯ ОТ РЯДА ФАКТОРОВ ОПИСЫВАЕТСЯ ПРИ ПОМОЩИ

1) логистической регрессии

2) множественной регрессии

3) экспоненциальной регрессии

4) линейной регрессии

Правильный ответ: 1

31. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ИЗМЕРЯЕТСЯ В

2) тех же единицах, что и изучаемый признак

4) не имеет единиц измерения

Правильный ответ: 4

32. ИЗ НИЖЕПЕРЕЧИСЛЕННЫХ ВЕЛИЧИН ДЛЯ ОПРЕДЕЛЕНИЯ РАЗМЕРА ОДНОГО ПРИЗНАКА ПРИ ИЗМЕНЕНИИ ДРУГОГО НА ЕДИНИЦУ ИЗМЕРЕНИЯ ПРИМЕНЯЕТСЯ

Источник

Библиотека постов MEDSTATISTIC об анализе медицинских данных

Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic

Критерии и методы

КРИТЕРИЙ КОРРЕЛЯЦИИ ПИРСОНА

Карл Пирсон

Карл Пирсон

​ – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсона позволяет определить, изменяется ли (возрастает или уменьшается) один показатель в ответ на изменения другого? В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.

1. История разработки критерия корреляции

Критерий корреляции Пирсона был разработан командой британских ученых во главе с Карлом Пирсоном (1857-1936) в 90-х годах 19-го века, для упрощения анализа ковариации двух случайных величин. Помимо Карла Пирсона над критерием корреляции Пирсона работали также Фрэнсис Эджуорт и Рафаэль Уэлдон.

2. Для чего используется критерий корреляции Пирсона?

Критерий корреляции Пирсона позволяет определить, какова теснота (или сила) корреляционной связи между двумя показателями, измеренными в количественной шкале. При помощи дополнительных расчетов можно также определить, насколько статистически значима выявленная связь.

Например, при помощи критерия корреляции Пирсона можно ответить на вопрос о наличии связи между температурой тела и содержанием лейкоцитов в крови при острых респираторных инфекциях, между ростом и весом пациента, между содержанием в питьевой воде фтора и заболеваемостью населения кариесом.

3. Условия и ограничения применения критерия хи-квадрат Пирсона

  1. Сопоставляемые показатели должны быть измерены в количественной шкале (например, частота сердечных сокращений, температура тела, содержание лейкоцитов в 1 мл крови, систолическое артериальное давление).
  2. Посредством критерия корреляции Пирсона можно определить лишь наличие и силу линейной взаимосвязи между величинами. Прочие характеристики связи, в том числе направление (прямая или обратная), характер изменений (прямолинейный или криволинейный), а также наличие зависимости одной переменной от другой — определяются при помощи регрессионного анализа.
  3. Количество сопоставляемых величин должно быть равно двум. В случае анализ взаимосвязи трех и более параметров следует воспользоваться методом факторного анализа.
  4. Критерий корреляции Пирсона является параметрическим, в связи с чем условием его применения служит нормальное распределение каждой из сопоставляемых переменных. В случае необходимости корреляционного анализа показателей, распределение которых отличается от нормального, в том числе измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена.
  5. Следует четко различать понятия зависимости и корреляции. Зависимость величин обуславливает наличие корреляционной связи между ними, но не наоборот.

Например, рост ребенка зависит от его возраста, то есть чем старше ребенок, тем он выше. Если мы возьмем двух детей разного возраста, то с высокой долей вероятности рост старшего ребенка будет больше, чем у младшего. Данное явление и называется зависимостью, подразумевающей причинно-следственную связь между показателями. Разумеется, между ними имеется и корреляционная связь, означающая, что изменения одного показателя сопровождаются изменениями другого показателя.

В другой ситуации рассмотрим связь роста ребенка и частоты сердечных сокращений (ЧСС). Как известно, обе эти величины напрямую зависят от возраста, поэтому в большинстве случаев дети большего роста (а значит и более старшего возраста) будут иметь меньшие значения ЧСС. То есть, корреляционная связь будет наблюдаться и может иметь достаточно высокую тесноту. Однако, если мы возьмем детей одного возраста, но разного роста, то, скорее всего, ЧСС у них будет различаться несущественно, в связи с чем можно сделать вывод о независимости ЧСС от роста.

Приведенный пример показывает, как важно различать фундаментальные в статистике понятия связи и зависимости показателей для построения верных выводов.

4. Как рассчитать коэффициента корреляции Пирсона?

Расчет коэффициента корреляции Пирсона производится по следующей формуле:

5. Как интерпретировать значение коэффициента корреляции Пирсона?

Значения коэффициента корреляции Пирсона интерпретируются исходя из его абсолютных значений. Возможные значения коэффициента корреляции варьируют от 0 до ±1. Чем больше абсолютное значение rxy – тем выше теснота связи между двумя величинами. rxy = 0 говорит о полном отсутствии связи. rxy = 1 – свидетельствует о наличии абсолютной (функциональной) связи. Если значение критерия корреляции Пирсона оказалось больше 1 или меньше -1 – в расчетах допущена ошибка.

Для оценки тесноты, или силы, корреляционной связи обычно используют общепринятые критерии, согласно которым абсолютные значения rxy 0.7 — о сильной связи.

Более точную оценку силы корреляционной связи можно получить, если воспользоваться таблицей Чеддока:

Абсолютное значение rxy Теснота (сила) корреляционной связи
менее 0.3 слабая
от 0.3 до 0.5 умеренная
от 0.5 до 0.7 заметная
от 0.7 до 0.9 высокая
более 0.9 весьма высокая

Оценка статистической значимости коэффициента корреляции rxy осуществляется при помощи t-критерия, рассчитываемого по следующей формуле:

Полученное значение tr сравнивается с критическим значением при определенном уровне значимости и числе степеней свободы n-2. Если tr превышает tкрит, то делается вывод о статистической значимости выявленной корреляционной связи.

6. Пример расчета коэффициента корреляции Пирсона

Целью исследования явилось выявление, определение тесноты и статистической значимости корреляционной связи между двумя количественными показателями: уровнем тестостерона в крови (X) и процентом мышечной массы в теле (Y). Исходные данные для выборки, состоящей из 5 исследуемых (n = 5), сведены в таблице:

N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y)
1. 951 83
2. 874 76
3. 957 84
4. 1084 89
5. 903 79
    Вычислим суммы анализируемых значений X и Y:

Σ(X) = 951 + 874 + 957 + 1084 + 903 = 4769

Σ(Y) = 83 + 76 + 84 + 89 + 79 = 441

Найдем средние арифметические для X и Y:

Mx = Σ(X) / n = 4769 / 5 = 953.8

My = Σ(Y) / n = 441 / 5 = 82.2

  • Рассчитаем для каждого значения сопоставляемых показателей величину отклонения от среднего арифметического dx = X — Mx и dy = Y — My:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy)
    1. 951 83 -2.8 0.8
    2. 874 76 -79.8 -6.2
    3. 957 84 3.2 1.8
    4. 1084 89 130.2 6.8
    5. 903 79 -50.8 -3.2
  • Возведем в квадрат каждое значение отклонения dx и dy:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy) dx 2 dy 2
    1. 951 83 -2.8 0.8 7.84 0.64
    2. 874 76 -79.8 -6.2 6368.04 38.44
    3. 957 84 3.2 1.8 10.24 3.24
    4. 1084 89 130.2 6.8 16952,04 46.24
    5. 903 79 -50.8 -3.2 2580,64 10.24
  • Рассчитаем для каждой пары анализируемых значений произведение отклонений dx x dy:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy) dx 2 dy 2 dx x dy
    1. 951 83 -2.8 0.8 7.84 0.64 -2.24
    2. 874 76 -79.8 -6.2 6368.04 38.44 494.76
    3. 957 84 3.2 1.8 10.24 3.24 5.76
    4. 1084 89 130.2 6.8 16952,04 46.24 885.36
    5. 903 79 -50.8 -3.2 2580,64 10.24 162.56
  • Определим значения суммы квадратов отклонений Σ(dx 2 ) и Σ(dy 2 ):

    Найдем значение суммы произведений отклонений Σ(dx x dy):

    Рассчитаем значение коэффициента корреляции Пирсона rxy по приведенной выше формуле:

    Найдем значение t-критерия для оценки статистической значимости корреляционной связи:

    Критическое значение t-критерия найдем по таблице, где при числе степеней свободы f = n-2 = 3 и уровне значимости p = 0.01 значение tкрит = 5.84. Рассчитанное значение tr (7.0) больше tкрит (5.84), следовательно связь является статистически значимой.

    Сделаем статистический вывод:

    Источник

    С какой целью рассчитывается корреляционное отношение тест

    Для измерения тесноты связи между двумя явлениями используется корреляционное отношение , предложенное Пирсоном. Его определяют по данным, сгруппированным по объясняющей переменной либо по корреляционной таблице. В обоих случаях вычисляют частные, или условные, средние зависимой переменной по каждой группе значений объясняющей переменной.

    Процедуры вычислений корреляционного отношения и индекса корреляции очень схожи. Различие заключается лишь в том, что при вычислении корреляционного отношения исходят из частных средних, а не из соответствующих значений регрессии. Следовательно, оно не связано с определенной функцией регрессии. Чтобы связать эти два понятия, можно корреляционное отношение интерпретировать следующим образом. При его определении предполагаем, что мы исходим из такой функции регрессии, которой соответствует кривая, проходящая через все точки частных средних зависимой переменной. Введем обозначения (см. раздел 2.6): частота группы (интервала) значений объясняющей переменной — частное среднее переменной у для группы (интервала) значений объясняющей переменной значение зависимой переменной у в группе (интервале) значений объясняющей переменной

    По аналогии с индексом корреляции определим теперь корреляционное отношение:

    Используя разложение дисперсии на составляющие, представим корреляционное отношение по аналогии с коэффициентом парной детерминации следующим образом:

    Здесь межгрупповая дисперсия, характеризующая рассеяние частных средних относительно общего среднего — среднее из частных дисперсий, служащее для характеристики среднего рассеяния значений переменной внутри групп. Из формул (7.9)-(7.11) видно, что корреляционное отношение вычисляется только по сгруппированному числовому материалу. При использовании любой из этих формул должна быть известна общая дисперсия Если в распоряжении имеются результаты группировок по объясняющей переменной с указанием только частных средних и нет доступа к исходному числовому материалу, то корреляционное отношение вычислить невозможно.

    Если числовой материал представлен в виде корреляционной таблицы, то удобно для практических расчетов пользоваться формулами, полученными из (7.9) по аналогии с (6.10):

    Здесь — середина интервала значений переменной — частота этого интервала, — условная частота интервала значений переменной у и интервала значений переменной х (частота, указанная в клетке корреляционной таблицы). Возможные значения корреляционного отношения заключены в интервале

    Если т.е. частные средние совпадают со значениями переменной то Если т. е. все частные средние лежат на одной прямой, проведенной параллельно оси абсцисс на расстоянии у от нее, . В последнем случае говорят об отсутствии связи между переменными в том смысле, как ее понимают в корреляционном анализе.

    На величину корреляционного отношения оказывает влияние произведенная группировка статистического материала. Чем больше выделено групп по объясняющей переменной, тем меньше значений зависимой переменной попадает в каждую группу, тем большему рассеянию подвержены частные средние относительно общего среднего, т. е. тем больше сказывается влияние неучтенных второстепенных факторов и случайностей. Следовательно, межгрупповая дисперсия частных средних с ростом числа групп, как правило, увеличивается, а общая дисперсия остается без изменения. В основном наблюдается такая тенденция: с ростом числа групп по объясняющей переменной корреляционное

    (кликните для просмотра скана)

    отношение увеличивается. При фиксированном количестве групп по объясняющей переменной корреляционное отношение зависит также от группировки значений зависимой переменной. Чаще всего корреляционное отношение тем больше, чем дифференцированнее группировка по зависимой переменной. Все это надо иметь в виду при использовании корреляционного отношения в качестве показателя тесноты связи.

    Как уже отмечалось, при вычислении корреляционного отношения не ориентируются ни на какой вид функции регрессии. Поэтому по нему нельзя сделать никакого вывода о надежности оценки регрессии. Поскольку при вычислении корреляционного отношения исходят из частных средних, вполне очевидно, что Поэтому для измерения интенсивности зависимости переменной х от переменной у вычисляют корреляционное отношение, по формуле, которую легко получить из (7.12) или (7.13) подстановкой в них другой переменной.

    Вычислим корреляционное отношение для зависимости объема производства от основных фондов (см. табл. 5 из раздела 2.6). В табл. 14 произведено вычисление выражения , используемого далее в (7.13). В результате имеем:

    Полученное значение свидетельствует о тесной связи между объемом производства и основными фондами. Коэффициент корреляции Пирсона, вычисленный по тем же исходным данным, равен (см. раздел 4.2). Для нашего примера оба показателя незначительно отличаются друг от друга. Соотношения, существующие между обоими показателями, мы рассмотрим в следующем разделе.

    Источник

    Корреляционный анализ

    экономические науки

    • Дашкина Дарья Владимировна , бакалавр, студент
    • Башкирский государственный аграрный университет
    • КОРРЕЛЯЦИОННЫЕ ПОЛЯ
    • КОРРЕЛЯЦИЯ
    • КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
    • КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

    Похожие материалы

    • Проблемы обновления команды
    • Конфликты в профессиональной среде
    • Распределение ролей в команде
    • Формирование доверия в группе и энергии единства в команде
    • Мониторинг команды

    Исследователей нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, такая связь может наблюдаться между погрешностью аппаратной обработки экспериментальных данных и величиной скачков сетевого напряжения. Другим примером может служить связь между пропускной способностью канала передачи данных и соотношением сигнал/шум.

    В 1886 году английский естествоиспытатель Френсис Гальтон для обозначения характера подобного рода взаимодействий ввёл термин «корреляция». Позже его ученик Карл Пирсон разработал математическую формулу, позволяющую дать количественную оценку корреляционным связям признаков.

    Зависимости между величинами (факторами, признаками) разделяют на два вида: функциональную и статистическую.

    При функциональных зависимостях каждому значению одной переменной величины соответствует определенное значение другой переменной. Кроме того, функциональная связь двух факторов возможна только при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин. В случае зависимости величины от множества факторов, функциональная связь возможна, если первая величина не зависит ни от каких других факторов, кроме входящих в указанное множество.

    При статистической зависимости изменение одной из величин влечёт изменение распределения других величин, которые с определенными вероятностями принимают некоторые значения.

    Значительно больший интерес представляет другой частный случай статистической зависимости, когда существует взаимосвязь значений одних случайных величин со средним значением других, при той особенности, что в каждом отдельном случае любая из взаимосвязанных величин может принимать различные значения.

    Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией.

    Корреляционный анализ — метод, позволяющий обнаружить зависимость между несколькими случайными величинами.

    Корреляционный анализ решает две основные задачи:

    • Первая задача заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь. Это очень важно, так как от правильного выбора формы связи зависит конечный результат изучения взаимосвязи между признаками.
    • Вторая задача состоит в измерении тесноты, т.е. меры связи между признаками с целью установить степень влияния данного фактора на результат. Она решается математически путем определения параметров корреляционного уравнения.

    Затем проводятся оценка и анализ полученных результатов при помощи специальных показателей корреляционного метода (коэффициентов детерминации, линейной и множественной корреляции и т.д.), а также проверка существенности связи между изучаемыми признаками.

    Методами корреляционного анализа решаются следующие задачи:

    1. Взаимосвязь. Есть ли взаимосвязь между параметрами?
    2. Прогнозирование. Если известно поведение одного параметра, то можно предсказать поведение другого параметра, коррелирующего с первым.
    3. Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации.

    Корреляция — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). Суть ее заключается в том, что при изменении значения одной переменной происходит закономерное изменение (уменьшению или увеличению) другой переменной.

    Для определения наличия взаимосвязи между двумя свойствами используется коэффициент корреляции.

    Коэффициент корреляции р для генеральной совокупности, как правило, неизвестен, поэтому он оценивается по экспериментальным данным, представляющим собой выборку объема n пар значений (xi, yi), полученную при совместном измерении двух признаков Х и Y. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции). Его принято обозначать символом r.

    К основным свойствам коэффициента корреляции относятся:

    1. Коэффициенты корреляции способны характеризовать только линейные связи, т.е. такие, которые выражаются уравнением линейной функции. При наличии нелинейной зависимости между варьирующими признаками следует использовать другие показатели связи.
    2. Значения коэффициентов корреляции – это отвлеченные числа, лежащее в пределах от -1 до +1, т.е. -1 0 имеет место положительная корреляция (с увеличением x значения y в целом имеют тенденцию к возрастанию), при p 0,70);
    3. средняя (при 0,50

    Список литературы

    1. Аблеева, А. М. Формирование фонда оценочных средств в условиях ФГОС [Текст] / А. М. Аблеева, Г. А. Салимова // Актуальные проблемы преподавания социально-гуманитарных, естественно — научных и технических дисциплин в условиях модернизации высшей школы : материалы международной научно-методической конференции, 4-5 апреля 2014 г. / Башкирский ГАУ, Факультет информационных технологий и управления. — Уфа, 2014. — С. 11-14.
    2. Ганиева, А.М. Статистический анализ занятости и безработицы [Текст] / А.М. Ганиева, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры «Статистики и информационных систем в экономике» / Башкирский ГАУ. — Уфа, 2011. — С. 315-316.
    3. Исмагилов, Р. Р. Творческая группа — эффективная форма организации научных исследований в высшей школе [Текст] / Р. Р. Исмагилов, М. Х. Уразлин, Д. Р. Исламгулов // Научно-технический и научно-образовательный комплексы региона : проблемы и перспективы развития : материалы научно-практической конференции / Академия наук РБ, УГАТУ. — Уфа, 1999. — С. 105-106.
    4. Исламгулов, Д.Р. Компетентностный подход в обучении: оценка качества образования [Текст] / Д.Р. Исламгулов, Т.Н. Лубова, И.Р. Исламгулова // Современный научный вестник. – 2015. – Т. 7. — № 1. – С. 62-69.
    5. Исламгулов, Д. Р. Научно-исследовательская работа студентов — важнейший элемент подготовки специалистов в аграрном вузе [Текст] / Д. Р. Исламгулов // Проблемы практической подготовки студентов в вузе на современном этапе и пути их решения : сб. материалов науч.-метод. конф., 24 апреля 2007 года / Башкирский ГАУ. — Уфа, 2007. — С. 20-22.
    6. Лубова, Т.Н. Основа реализации федерального государственного образовательного стандарта – компетентностный подход [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова// БЪДЕЩИТЕ ИЗСЛЕДОВАНИЯ – 2016: Материали за XII Международна научна практична конференция, 15-22 февруари 2016. – София: Бял ГРАД-БГ ООД, 2016. – Том 4 Педагогически науки. – C. 80-85.
    7. Лубова, Т.Н. Новые образовательные стандарты: особенности реализации [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Современный научный вестник. – 2015. – Т. 7. — № 1. – С. 79-84.
    8. Лубова, Т.Н. Организация самостоятельной работы обучающихся [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Реализация образовательных программ высшего образования в рамках ФГОС ВО: материалы Всероссийской научно-методической конференции в рамках выездного совещания НМС по природообустройству и водопользованию Федерального УМО в системе ВО. / Башкирский ГАУ. — Уфа, 2016. — С. 214-219.
    9. Лубова, Т.Н. Основа реализации федерального государственного образовательного стандарта – компетентностный подход [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова // Современный научный вестник. – 2015. – Т. 7. — № 1. – С. 85-93.
    10. Саубанова, Л.М. Уровень демографической нагрузки [Текст] / Л.М. Саубанова, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры «Статистики и информационных систем в экономике» / Башкирский ГАУ. — Уфа, 2011. — С. 321-322.
    11. Фахруллина, А.Р. Статистический анализ инфляции в России [Текст] / А.Р. Фахруллина, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры «Статистики и информационных систем в экономике» / Башкирский ГАУ. — Уфа, 2011. — С. 323-324.
    12. Фархутдинова, А.Т. Рынок труда в Республике Башкортостан в 2012 году [Электронный ресурс] / А.Т. Фархутдинова, Т.Н. Лубова // Студенческий научный форум. Материалы V Международной студенческой электронной научной конференции: электронная научная конференция (электронный сборник). Российская академия естествознания. 2013.

    Завершение формирования электронного архива по направлению «Науки о Земле и энергетика»

    • 23 ноября 2020
  • Создание электронного архива по направлению «Науки о Земле и энергетика»

    Электронное периодическое издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), свидетельство о регистрации СМИ — ЭЛ № ФС77-41429 от 23.07.2010 г.

    Соучредители СМИ: Долганов А.А., Майоров Е.В.

    Источник