Главное меню >> Таблица >> Анализ, действия, расчеты >> Поиск зависимостей >> Множественная регрессия | Примеры
Чтобы провести регрессионный анализ, откройте дочернее окно работы с таблицами (меню "Окно \ Окно табличной информации"). Загрузите таблицу данных. Нажмите на кнопку "Анализ, действия, расчеты...".
Перейдите на вкладку "Регрессионный анализ".
Здесь прежде всего укажите столбец с предсказываемыми значениями. Для этого выделите нужный столбец и нажмите на кнопку "Y >>". Далее выделите все столбцы, которые будут выступать в качестве предикторов (переменных X).
Для нашего примера (таблица средних параметров по различным странам) попробуем найти модель определения средней длительности жизни от некоторых факторов.
Установим столбцы, выберем действия "Кросс-плот сравнения фактических и предсказанных значений". Нажмем кнопку "Выполнить".
Появится кросс-плот, на котором по оси X будут отложены прогнозные значения, а по оси Y - фактические значения. Очевидно, что в идеальном случае прогнозные и фактические значения будут совпадать и все точки окажутся на линии соответствия (которая показана на графике черной тонкой линией).
Параллельно на вкладке "Регрессионный анализ" будет отображено уравнение регрессии и коэффициент детерминации R2.
ДЛ.ЖИЗНИ=1.30303221794536*КОЛДЕТЕЙ-0.786768200159686*УР.СМЕРТ-0.331805959929056*УР.РОЖД+0.00246734217032427*КАЛОРИИ-0.123162068549145*ДЕТСМЕРТ+74.873189121293
R2 = 0.9505.
Согласно проведенным расчетам, модель предсказывает 95% дисперсии признаков. Качество модели хорошее.
Однако попробуем улучшить прогноз, проведя дополнительный анализ, который основывается на предположении, что для стран "разного уровня" регрессионные модели могут отличаться.
Разобъем все представленные в таблице страны на три группы (1, 2, 3) и вставим дополнительный столбец "Рейтинг страны". Добавим этот столбец как название (кнопка "Название >>"). Далее на вкладке "Регрессионный анализ" установим галочку "Раздельно по значениям из столбца названия". Нажмем кнопку "Выполнить".
Появится информационный кросс-плот, на котором видно что сходимость точек к линии соответствия лучше.
Количественно это можно оценить, нажав на кнопку "i". Будет показано среднее отклонение значений по модулю. В последнем случае это (|X-Y|. Среднее: 1.246), а в прошлом (|X-Y|. Среднее: 1.706).
Кроме того, для каждой группы можно посмотреть уравнения, количество объектов и R2, нажав на кнопку "Модели расчетов и прогнозов" (расположена справа от галочки "Сохранять модели расчета").
Чтобы провести регрессионный анализ, откройте дочернее окно работы с таблицами (меню "Окно \ Окно табличной информации"). Загрузите таблицу данных. Нажмите на кнопку "Анализ, действия, расчеты...".
Здесь прежде всего укажите столбец с предсказываемыми значениями. Для этого выделите нужный столбец и нажмите на кнопку "Y >>". Далее выделите все столбцы, которые будут выступать в качестве предикторов (переменных X).
Для нашего примера (таблица средних параметров по различным странам) попробуем найти модель определения средней длительности жизни от некоторых факторов.
Установим столбцы, выберем действия "Кросс-плот сравнения фактических и предсказанных значений". Нажмем кнопку "Выполнить".
Появится кросс-плот, на котором по оси X будут отложены прогнозные значения, а по оси Y - фактические значения. Очевидно, что в идеальном случае прогнозные и фактические значения будут совпадать и все точки окажутся на линии соответствия (которая показана на графике черной тонкой линией).
Параллельно на вкладке "Регрессионный анализ" будет отображено уравнение регрессии и коэффициент детерминации R2.
ДЛ.ЖИЗНИ=1.30303221794536*КОЛДЕТЕЙ-0.786768200159686*УР.СМЕРТ-0.331805959929056*УР.РОЖД+0.00246734217032427*КАЛОРИИ-0.123162068549145*ДЕТСМЕРТ+74.873189121293
R2 = 0.9505.
Согласно проведенным расчетам, модель предсказывает 95% дисперсии признаков. Качество модели хорошее.
Однако попробуем улучшить прогноз, проведя дополнительный анализ, который основывается на предположении, что для стран "разного уровня" регрессионные модели могут отличаться.
Разобъем все представленные в таблице страны на три группы (1, 2, 3) и вставим дополнительный столбец "Рейтинг страны". Добавим этот столбец как название (кнопка "Название >>"). Далее на вкладке "Регрессионный анализ" установим галочку "Раздельно по значениям из столбца названия". Нажмем кнопку "Выполнить".
Появится информационный кросс-плот, на котором видно что сходимость точек к линии соответствия лучше.
Количественно это можно оценить, нажав на кнопку "i". Будет показано среднее отклонение значений по модулю. В последнем случае это (|X-Y|. Среднее: 1.246), а в прошлом (|X-Y|. Среднее: 1.706).
Кроме того, для каждой группы можно посмотреть уравнения, количество объектов и R2, нажав на кнопку "Модели расчетов и прогнозов" (расположена справа от галочки "Сохранять модели расчета").
Уравнения можно сохранять в модуле "Модели расчетов и прогнозов".
Комментариев нет:
Отправить комментарий