Методы корреляционного и регрессионного анализа

Практическое использование этих методой предполагает наличие динамических рядов данных о загрязнении окружающей природной среды и результатах (отрицательных последствиях) загрязнения. Источником такой информации являются контрольные районы (регионы, города), в которых в течение определенного времени использовались виды деятельности, аналогичные (сходные) рассматриваемому виду.

Рассмотрим порядок применения данных методов на примере определения одной из центральных компонентов экономического ущерба от загрязнения окружающей природной среды, а именно — анализа влияния загрязнения окружающей среды на здоровье человека. В этом случае корреляционный анализ дает возможность установить направление, силу, степень и достоверность влияния факторов среды на уровень здоровья населения. Направление связи оценивается по алгебраическому знаку коэффициента корреляции. Оно может быть прямым (при положительном знаке этого коэффициента) и обратным (при отрицательном).

Силу связи оценивают по коэффициенту линейной корреляции r: при значении r = 0,1-0,29 связь считается слабой, в интервале 0,3-0,69 связь признают средней (умеренной), а при r = 0,70 — 0,99 — сильной. Коэффициент линейной корреляции бывает трех видов — парный, парциальный и множественный. Парный коэффициент свидетельствует о «грубой» неочищенной связи между каким-либо фактором X1, и уровнем здоровья Y , так как на значение этого коэффициента оказывают влияние и другие факторы среды, особенно тесно связанные с X. Поэтому рекомендуется чаще использовать парциальные коэффициенты корреляции. Они отражают связь между исследуемыми факторами и уровнем здоровья в чистом виде, исключая влияние других факторов. Что касается множественного коэффициента корреляции, то он отражает одновременно связь всех исследуемых факторов со здоровьем человека.

Теоретически расчет и анализ коэффициентов возможен лишь в случае линейной связи между факторами и уровнем здоровья. Однако это требование можно не учитывать при одновременном исследовании нескольких факторов в многофакторных моделях. Кроме того, в случае представления исходных данных в логарифмическом виде и явно нелинейные функции могут быть хорошо описаны линейными коэффициентами корреляции.

Степень влияния факторов характеризуется так называемыми коэффициентами детерминации. Они представляют собой увеличенные в 100 раз (для перевода в проценты) квадраты парциальных коэффициентов корреляции. Эти коэффициенты отражают в процентах долю (удельный вес) влияния на здоровье населения данного фактора среди прочих других.

Достоверность влияния факторов определяется по средней ошибке коэффициента корреляции. Последний должен не менее чем в 2,5-3 раза превышать свою среднюю ошибку. Достоверность коэффициента корреляции обычно обеспечивается достаточно большим количеством лет наблюдения или числом одновременно исследуемых зон (населенных пунктов), т.е. длиной соответствующих динамических рядов исходных данных. Обычно рекомендуется использовать следующее эмпирическое правило, согласно которому количество лет наблюдения или количество исследуемых зон (населенных пунктов) должно быть минимум в 5-6 раз больше числа одновременно учитываемых факторов, влияющих на уровень здоровья населения.

Ссылка на основную публикацию
Adblock
detector