Большая Советская энциклопедия - корреляция
Связанные словари
Корреляция
I
Корреля́ция (от позднелат. correlatio — соотношение)
термин, применяемый в различных областях науки и техники для обозначения взаимозависимости, взаимного соответствия, соотношения понятий, предприятий, предметов, функций. См. также Корреляция в математической статистике, Корреляция в биологии, Корреляция в лингвистике.
II
Корреля́ция
в математической статистике, вероятностная или статистическая зависимость, не имеющая, вообще говоря, строго функционального характера. В отличие от функциональной, корреляционная зависимость возникает тогда, когда один из признаков зависит не только от данного второго, но и от ряда случайных факторов или же когда среди условий, от которых зависят и тот и другой признаки, имеются общие для них обоих условия. Пример такого рода зависимости даёт корреляционная таблица. Из таблицы видно, что при увеличении высоты сосен в среднем растет и диаметр их стволов; однако сосны заданной высоты (например, 23 м) имеют распределение диаметров с довольно большим рассеянием. Если в среднем 23-метровые сосны толще 22-метровых, то для отдельных сосен это соотношение может заметным образом нарушаться. Статистическая К. в обследованной конечной совокупности наиболее интересна тогда, когда она указывает на существование закономерной связи между изучаемыми явлениями.
В основе теории К. лежит предположение о том, что изучаемые явления подчинены определённым вероятностным закономерностям (см. Вероятность, Вероятностей теория). Зависимость между двумя случайными событиями проявляется в том, что условная вероятность одного из них при наступлении другого отличается от безусловной вероятности. Аналогично, влияние одной случайной величины на другую характеризуется законами условных распределений первой при фиксированных значениях второй. Пусть для каждого возможного значения Х = х определено условное математическое ожидание у (х) = Е (YIX = х) величины Y (см. Математическое ожидание). Функция у (х) называется регрессией величины Y по X, а её график — линией регрессии Y по X. Зависимость Y от Х проявляется в изменении средних значений Y при изменении X, хотя при каждом Х = х величина Y остаётся случайной величиной с определенным рассеянием. Пусть mY = Е (Y) — безусловное математическое ожидание Y. Если величины независимы, то все условные математические ожидания Y не зависят от х и совпадают с безусловными:
у (х) = Е (YIX = х) = Е (Y) = mY.
Обратное заключение не всегда справедливо. Для выяснения вопроса, насколько хорошо регрессия передаёт изменение Y при изменении X, используется условная дисперсия Y при данном значении Х = х или её средняя величина — дисперсия Y относительно линии регрессии (мера рассеяния около линии регрессии):
2.
При строгой функциональной зависимости величина Y при данном Х = х принимает лишь одно определенное значение, то есть рассеяние около линии регрессии равно нулю.
Линия регрессии может быть приближённо восстановлена по достаточно обширной корреляционной таблице: за приближённое значение у (х) принимают среднее из тех наблюдённых значений Y, которым соответствует значение Х = х. На рисунке изображена приближённая линия регрессии для зависимости среднего диаметра сосен от высоты в соответствии с таблицей. В средней части эта линия, по-видимому, хорошо выражает действительная закономерность. Если число наблюдений, соответствующих некоторым значениям X, недостаточно велико, то такой метод может привести к совершенно случайным результатам. Так, точки линии, соответствующие высотам 29 и 30 м, ненадёжны ввиду малочисленности материала. См. Регрессия.
В случае К. двух количественных случайных признаков обычным показателем концентрации распределения вблизи линии регрессии служит корреляционное отношение