Примеры решения типовых задач icon

Примеры решения типовых задач



НазваниеПримеры решения типовых задач
страница1/4
Дата конвертации20.02.2013
Размер0.52 Mb.
ТипАнализ
  1   2   3   4

Примеры решения типовых задач

1. Корреляционный анализ

Анализ взаимосвязи социально-экономических показателей группы стран

В ходе корреляционного анализа выявляется статистическая взаимосвязь между признаками, и отбираются переменные для включения в регрессионную модель. Предпосылками корреляционного анализа являются случайность признаков и нормальный многомерный закон их совместного распределения. Поэтому необходимым условием для его проведения является однородность выборки, простейший способ обеспечения которой – группировка объектов по общности их основных свойств.


По данным 1995 года о 20 бывших и нынешних социалистических странах, взятых из таблицы ПРИЛОЖЕНИЯ 1, рассчитана матрица выборочных парных коэффициентов корреляции





xl

x2

х3

x4

х5

х6

х7

х8

х9

xl

1

-0,879

-0,758

-0,556

0,767

-0,600

0,826

-0,580

0,698

x2




1

0,817

0,710

-0,591

0,631

-0,676

0,406

-0,514

х3







1

0,717

-0,515

0,664

-0,615

0,433

-0,466

x4










1

-0,249

0,624

-0,329

0,313

-0,057

х5













1

-0,604

0,963

-0,865

0,851

х6
















1

-0,658

0,612

-0,419

х7



















1

-0,833

0,906

х8






















1

-0,637

х9

























1
Исследуемый признак − x1 − детская смертность (число умерших младенцев на 1000 новорожденных).

Требуется:

  1. Проверить значимость каждого из коэффициентов на уровне значимости =0,05.

  2. Определить признаки, наиболее важные для объяснения вариации исследуемой переменной, рассчитать выборочные частные коэффициенты корреляции исследуемого признака с каждым из признаков при фиксированном значении остальных. Найти интервальные оценки частных коэффициентов корреляции, определить значимость коэффициентов. Сравнить частные коэффициенты корреляции с соответствующими парными и сделать выводы относительно роли исключенной переменной в изменении степени тесноты статистической связи, характеризуемой этими коэффициентами корреляции.

  3. Рассчитать значение множественного коэффициента корреляции исследуемого признака с выбранными в п.2 признаками. Найти коэффициент детерминации, проверить его значимость.

Решение

1) Определим по таблице Фишера-Йейтса критическое значение rкр для одного из наиболее часто использующихся уровней значимости  = 0,05. С учетом объема выборки n = 20 находим число степеней свободы  = n − 2 = 18. По данным таблицы получаем rкр = 0,444.

Для выборочных парных коэффициентов корреляции rij, абсолютная величина которых превосходит критическое значение, отвергается гипотеза о равенстве нулю соответствующих им истинных коэффициентов корреляции (H0: ρij=0), и они считаются значимыми. Остальные истинные значения коэффициентов корреляции от нуля существенно не отличаются. Подчеркнем значимые коэффициенты корреляции




xl

x2

х3

x4

х5

х6

х7

х8

х9

xl

1

-0,879

-0,758

-0,556

0,767

-0,600

0,826

-0,580

0,698

x2




1

0,817

0,710

-0,591

0,631

-0,676

0,406

-0,514

х3







1

0,717

-0,515

0,664

-0,615

0,433

-0,466

x4










1

-0,249

0,624

-0,329

0,313

-0,057

х5













1

-0,604

0,963

-0,865

0,851

х6
















1

-0,658

0,612

-0,419

х7



















1

-0,833

0,906

х8






















1

-0,637

х9

























1

С вероятностью 1-=0,95 можно утверждать наличие статистически значимой связи между i-м и j-м признаками, выборочный парный коэффициент корреляции которых rij значим. Связь между другими признаками с такой мерой уверенности не установлена (что, впрочем, не дает оснований говорить о ее отсутствии).

2) Среди признаков, которые могут обусловливать вариацию детской смертности, выделим уровень грамотности населения (х4) и среднее число детей в семье (х9). Соответствующие парные коэффициенты корреляции значимы и свидетельствуют о наличии существенной связи между этими переменными и исследуемой переменной. Ограничив корреляционную модель исследуемой переменной и двумя выбранными признаками, запишем для нее матрицу парных коэффициентов корреляции, взяв значения коэффициентов из общей корреляционной матрицы





xl

x4

х9

xl

1

-0,556

0,698

x4

-0,556

1

-0,057

х9

0,698

-0,057

1




Вычислим выборочные частные коэффициенты корреляции между xl и x4 при фиксированном х9 по формуле:



После подстановки значений получаем:



Аналогично определяем другой выборочный частный коэффициент корреляции между xl и x9 при фиксированном х4:



Выборочные частные коэффициенты корреляции r14(9) и r19(4) не отличаются по знаку от соответствующих парных коэффициентов r14 и r19, но превосходят их по абсолютной величине. Следовательно, исключаемый признак х9 ослабляет взаимосвязь между признаками x1 и x4, а признак x4 ослабляет связь признаков x1 и х9.

Рассчитаем интервальные оценки парных коэффициентов корреляции. Определяемая значением выборочного коэффициента корреляции величина z=, называемая z-преобразованием Фишера, распределена приближенно нормально с математическим ожиданием z=и дисперсией 2=, где m число исключенных величин, ρ – истинное значение коэффициента корреляции. Интервальная оценка для нормально распределенной величины определяется выражением:



где (tу) – интеграл Лапласа,

– несмещенная оценка математического ожидания.

Для выборочного частного коэффициента корреляции r14(9) = -0,722 по таблице z-преобразования Фишера находим . Используя последнее значение и определив по таблице нормального закона распределения для (tу) = l –  = 0,95 величину ty=1,96, а также учитывая, что = получаем Р(−0,91−1,960,25 < z < −0,91+1,960,25) = 0,95, откуда

Р(−1,4 < z <−0,42) = 0,95

По таблице z-преобразования Фишера находим значения коэффициента корреляции , соответствующие границам интервала величины z, и определяем его интервальную оценку

Р(0,89 < 14(9) < 0,40) = 0,95.

В интервале возможных значений частного коэффициента корреляции нуль не содержится, поэтому с вероятностью 0,95 можно утверждать, что частный коэффициент корреляции нулю не равен. Диапазон возможных значения частного коэффициента корреляции показывает, что между детской смертностью и грамотности взрослого населения существует обратная линейная статистическая зависимость, степень тесноты которой либо умеренная, либо сильная.

Аналогично получим интервальную оценку для другого частного коэффициента корреляции

Р(0,71 <19(4) < 0,92) = 0,95.

Этот коэффициент также является значимым, а диапазон его значений указывает на прямую зависимость детской смертности от среднего числа детей в семье.

Рассчитаем значение выборочного множественного коэффициента корреляции исследуемого признака x1 по формуле



Подставим значения выборочных парных коэффициентов корреляции и получим



Рассчитанный коэффициент является выборочным значением множественного коэффициента корреляции − максимального среди взятых по модулю парных коэффициентов корреляции переменной x1 с линейными комбинациями признаков х4 и х9. Квадрат множественного коэффициента корреляции − коэффициент детерминации 21(49) − показывает долю дисперсии исследуемой случайной переменной, обусловленную вариацией включенных в модель признаков. Выборочное значение коэффициента детерминации . Остальные 24,5% дисперсии исследуемой переменной обусловлены действием признаков, не включенных в модель. С помощью F-критерия определим значимость коэффициента детерминации, проверив гипотезу Но: 21(49) = 0. Вычислим значение F-статистики



Рассчитанное значение FH =26,16 сравним с критическим Fкр= 3,59, найденным по таблице Фишера-Снедекора для уровня значимости  = 0,05 и числа степеней свободы числителя 1 = 2 и знаменателя 2 = n − 3 = 17.

Так как рассчитанное значение превышает критическое, проверяемая гипотеза отвергается, и с вероятностью 1  = 0,95 можно утверждать, что множественный коэффициент корреляции 1(49) не равен нулю. Следовательно, существует статистически значимая связь детской смертности с уровнем грамотности взрослого населения и средним числом детей в семье.

2. Регрессионный анализ

Регрессионная модель уровня детской смертности

В ходе регрессионного анализа выявляется форма и параметры зависимости одного из признаков, называемого зависимой переменной, от других - объясняющих переменных, считающихся неслучайными величинами. Зависимая переменная представляет собой наиболее важный из практических соображений признак. Отбор признаков для использования в качестве объясняющих переменных производится на основе анализа их содержательной сущности и результатов корреляционного анализа. При этом из признаков, связанных зависимостью, близкой к неслучайной функциональной, выбирают какой-либо один во избежание эффекта мультиколлинеарности объясняющих переменных. Выбор вида уравнения регрессии определяется сущностью изучаемого явления. Простейшей из регрессионных моделей является линейная. Оценка параметров уравнения входит в число важнейших задач регрессионного анализа. Наряду с нахождением значений параметров оценивается их точность, проверяется значимость уравнения и его коэффициентов.

По данным 1995 года о 20 бывших и нынешних социалистических странах, взятых из таблицы ПРИЛОЖЕНИЯ 1, наряду с приведенной выше матрицей выборочных парных коэффициентов корреляции, построены уравнения регрессии. В этих уравнениях зависимой переменной является социально значимый признак x1 − детская смертность (число умерших младенцев на 1000 новорожденных). В качестве объясняющих переменных использованы признаки в различных комбинациях

у = 99,891 − 0,225х3 − 0,957х4 + 0,215х6 + 12,994х9; R2 = 0,774; F = 12,883;

(42,430) (0,200) (0,564) (1,005) (3,738)

у = 31,134 − 0,497х3 + 9,939x9; R2 = 0,726; F = 22,556;

(12,652) (0,128) (3,241)

у = 30,980 − 0,445х3 − 0,493х6 + 9,661х9; R2 = 0,730; F = 14,455;

(12,945) (0,161) (0,989) (3,365)

у = 121,093 − 1,354 х4 + 15,099 х9; R2 = 0,775; F = 26,159;

(31,207) (0,314) (2,718)

Для каждого уравнения рассчитаны значения коэффициентов детерминации и F- статистик. Под коэффициентами приведены значения их выборочных средних квадратических отклонений.

Требуется

    1. Используя критерий Фишера, проверить на уровне  = 0,05 значимость каждого из уравнений регрессии. В значимых уравнениях рассчитать значения t-статистик всех коэффициентов. Переписать уравнения регрессии, указывая под коэффициентами значения t-статистик.

    2. По таблице распределения Стьюдента определить tкр − критическое значение t- статистики для каждого из уравнений на уровне значимости  = 0,05. Проверить значимость коэффициентов уравнения регрессии.

    3. Выбрать из предложенных уравнений наилучшее. Рассчитать интервальные оценки его коэффициентов. Произвести анализ уравнения.

Решение

1) Для каждого из уравнения определим Fкp − критическое значение F-статистики по таблице Фишера-Снедекора при уровне значимости  = 0,05 и числе степеней свободы числителя р, а знаменателя  = n − p − 1, где р − число регрессоров в уравнении. Получаем

Fкp1(0,05;4;15) = 3,06; Fкp2(0,05;2;17) = Fкp4 = 3,59; Fкp3(0,05;3;16) = 3,24.

Значения F-статистик всех уравнений превышают соответствующие критические значения. Следовательно, все уравнения являются статистически значимыми.

Для проверки значимости коэффициентов проверим гипотезу о равенстве нулю каждого истинного значения  каждого из них Но:  = 0. Для этого вычислим по выборочному значению b каждого коэффициента и его выборочному среднему квадратическому отклонению S статистику



Для первого коэффициента первого уравнения tH = 99,891/42,430 = 2,354. Вычислим значения остальных t-статистик и запишем уравнения с указанием их значений

у = 99,891 − 0,225х3 − 0,957х4 + 0,215х6 + 12,994х9; R2=0,774; F=12,883;

(2,354) (-1,125) (-1,696) (0,210) (3,476)

у = 31,134 − 0,497х3 + 9,939x9; R2 = 0,726; F = 22,556;

(2,461) (-3,856) (3,067)

у = 30,980 − 0,445х3 − 0,493х6 + 9,661х9; R2 = 0,730; F = 14,455;

(2,393) (-2,770) (-0,499) (2,871)

у = 121,093 − 1,354 х4 + 15,099 х9; R2 = 0,775; F = 26,159;

(3,880) (-4,309) (5,554)

      1. Критические значения t-статистик обычно лежат в интервале от 2 до 3. Рассчитаем их для каждого уравнения по таблице распределения Стьюдента для уровня значимости  = 0,05 и числе степеней свободы числителя р, а знаменателя  = n − p −1, где р − число регрессоров в уравнении.

tкp1(0,05;15) = 2,131; tкp2(0,05;17) = tкp4(0,05;17) = 2,110; tкp3(0,05;16) = 2,120.

Сравним абсолютные величины t-статистик с критическими значениями.

Если |tH|> tкp, то с вероятностью 1 −  = 0,95 истинный коэффициент уравнения регрессии нулю не равен, и соответствующий признак влияет на вариацию зависимой переменной. В противном случае предположение о нулевом значении коэффициента и, следовательно, об отсутствии влияния регрессора на поведение зависимой переменной не противоречит имеющимся данным, и такой коэффициент считается незначимым.

Выделим значимые коэффициенты в каждом уравнении

у =99,891 0,225x3 0,957x4 + 0,215x6 + 12,994х9; tкp =2,131; R2=0,774; F=12,883;

(2,354) (-1,125) (-1,696) (0,210) (3,476)

у = 31,134 − 0,497х3 + 9,939x9; tкp=2,l 10; R2=0,726; F=22,556;

(2,461) (-3,856) (3,067)

у = 30,980 − 0,445х3 0,493x6 + 9,661x9; tкp=2,120; R2=0,730; F=14,455;

(2,393) (-2,770) (-0,499) (2,871)

у = 121,093 - 1,354x4 + 15,099x9; tкp=2,110; R2=0,775; F=26,159.

(3,880) (-4,309) (5,554)

Во втором и четвертом уравнениях все коэффициенты значимы.

      1. Для практического использования пригодны лишь уравнения со значимыми коэффициентами при регрессорах. Выберем из соответствующих данному условию уравнений то, которое характеризуется наибольшей величиной коэффициента детерминации R2

у = 121,093 - 1,354x4 + 15,099x9; tкp=2,110; R2=0,775; F=26,159.

(3,880) (-4,309) (5,554)

Рассчитаем интервальные оценки его коэффициентов

P(b − tSb <  < b + tSb) = 

По таблице распределения Стьюдента для доверительной вероятности  = 1  = 0,95 найдем с учетом числа степеней свободы  = n − p −1 значение t = t0,05 = 2,110. С учетом приведенных в исходных данных значений выборочных средних квадратических отклонений Sb коэффициентов определим интервальную оценку коэффициента b0

P(b0 − tSb0 < 0 < b0 + tSb0) = ,

P(121,093 2,11031,207 < 0 < 121,093 + 2,11031,207) = 0,95,

P(55,246 < 0 < 186,940) = 0,95,

и остальных коэффициентов

P(-2,017 < 1 < -0,691) = 0,95,

P(9,364 < 2 < 20,834) = 0,95,

Нуль не содержится ни в одном из рассчитанных интервалов возможных значений коэффициентов уравнения регрессии, что еще раз свидетельствует о значимости каждого из коэффициентов.

С увеличением уровня грамотности населения на один процент детская смертность снижается в среднем на 1,354 событий на 1000 новорожденных, при этом с вероятностью 0,95 снижение составляет в худшем случае 0,691, а лучшем случае 2,017 событий на 1000 новорожденных.

Рост среднего числа детей в семье на одного ребенка сопровождается увеличением детской смертности в среднем на 15,099 событий на 1000 новорожденных. Соответственно, с вероятностью 0,95 в худшем случае это увеличение произойдет на 20,834, а в лучшем − на 9,364 событий на 1000 новорожденных.

3. Нелинейные регрессионные модели

При анализе расходов на продовольственные товары в общих расходах (%) семи семей Москвы в зависимости от среднемесячной заработной платы (тыс. руб.) получены следующие данные, представленные в табл.3.1

Таблица 3.1.

Номер семьи

Расходы на покупку продовольственных товаров в общих расходах (%)

Среднемесячная заработная плата работающих (тыс. руб.)

1

61,2

59,0

2

59,9

57,2

3

56,7

61,8

4

55,0

58,8

5

54,3

47,2

6

49,3

55,2

7

68,8

45,1
  1   2   3   4




Похожие:

Примеры решения типовых задач iconДополнительные вопросы алгебры. Рекуррентные последовательности
Строится алгебра формальных рядов. В каждом разделе приведены решения типовых задач
Примеры решения типовых задач iconДокументи
1. /Решение задач/Контрольное задание ь1/Варианты для решения задач по теме ь1.doc
Примеры решения типовых задач iconДокументи
1. /Решение задач/Контрольное задание ь3/Варианты для решения задач по теме ь3.doc
Примеры решения типовых задач iconДокументи
1. /Решение задач/Контрольное задание ь1/Варианты для решения задач по теме ь1.doc
Примеры решения типовых задач iconАлгоритмизация и программирование Этапы решения задач на ЭВМ
Технология решения задач с помощью компьютера (моделирование, формализация, алгоритмизация, компьютерный эксперимент). Пример решения...
Примеры решения типовых задач iconПредисловие Цель предлагаемой работы — помочь тем, кто изучает дифференциальное исчисление, приобрести навык решения стандартных задач.
Рекомендуется перед выполнением индивидуальных заданий, ознакомиться с теорией и решением типовых примеров изложенных в данных методических...
Примеры решения типовых задач iconС. Л. Гладкий Л. Н. Ясницкий решение задач линейной термоупругости
Предложен аналитический метод решения линейных задач термоупругости. Дано краткое описание метода. Приведены частные решения плоских...
Примеры решения типовых задач iconУрок по математике 1 класс «Школа 2100». Закрепление. Цели и задачи: совершенствовать умение решать примеры на сложение и вычитание двузначных чисел без перехода через десяток
Закрепление решения задач двух видов. Решение уравнений с неизвестным вычитаемым, уменьшаемым и слагаемым
Примеры решения типовых задач iconТема урока «Координаты вектора. Решение задач с практическим содержанием»
Оборудование: таблицы (файлы) со схемами поиска решения задачи; карточки-информаторы (подсказки различного уровня энтропии); таблицы...
Примеры решения типовых задач iconПояснительная записка
В данном элективном курсе учащиеся обучаются методам решения задач с параметрами, начиная с самых простых линейных уравнений и неравенств...
Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©lib.podelise.ru 2000-2014
При копировании материала обязательно указание активной ссылки открытой для индексации.
обратиться к администрации
Документы

Разработка сайта — Веб студия Адаманов