Warning: WP Redis: Connection refused in /www/wwwroot/cmooc.com/wp-content/plugins/powered-cache/includes/dropins/redis-object-cache.php on line 1433
线性回归 | MOOC中国 - 慕课改变你,你改变世界

线性回归

Линейная регрессия

2418 次查看
圣彼得堡国立大学
Coursera
  • 完成时间大约为 34 个小时
  • 中级
  • 俄语
注:本课程由Coursera和Linkshare共同提供,因开课平台的各种因素变化,以上开课日期仅供参考

课程概况

В этом курсе мы разберем основные методы описания взаимосвязей между количественными признаками. Если корреляционный анализ позволяет количественно оценить силу и направление связи между двумя величинами, то построение регрессионных моделей дает более широкие возможности. При помощи регрессионного анализа можно количественно описывать поведение изучаемых величин в зависимости от переменных-предикторов и получать предсказания на новых данных. Вы узнаете, как строить простые и множественные линейные модели с использованием языка R. У всякого метода есть свои ограничения, поэтому мы поможем вам разобраться, в каких ситуациях можно, а в каких нельзя применять линейную регрессию, и научим вас методам диагностики подобранных моделей. Специальное место в курсе отводится глубинной анатомии регрессионного анализа: вы освоите операции с матрицами, которые лежат в основе линейной регрессии, чтобы получить возможность разбираться в более сложных разновидностях линейных моделей.

Если вы сталкиваетесь с необходимостью поиска и описания взаимосвязей между теми или иными явлениями, которые могут быть измерены количественно, тогда этот курс – хорошая возможность понять, как устроены простая и множественная линейная регрессия, узнать о возможностях и ограничениях этих методов. Курс рассчитан на тех, кто уже знаком с базовыми приемами анализа данных с использованием языка R и с созданием простейших .html документов при помощи rmarkdown и knitr.

课程大纲

Корреляционный анализ. Простая линейная регрессия

Мы начнем разговор о методах численного описания связей между количественными величинами с коэффициентов ковариации и корреляции, которые позволяют оценить силу и направление связи. Затем вы узнаете, какую дополнительную информацию о связях можно получить, построив линейную модель зависимости между величинами. Вы научитесь интерпретировать коэффициенты регрессии и узнаете, когда и как можно использовать линейные модели для предсказаний на новых данных. К концу этого модуля вы научитесь подбирать уравнение линейной модели и строить ее график с доверительной областью.

Проверка значимости и валидности линейных моделей

Построить линейную модель и записать ее уравнение - это только самое начало анализа. В этом модуле вы узнаете, как описывать результаты регрессионного анализа: как проверить статистическую значимость модели в целом или ее коэффициентов, оценить качество подгонки. У линейных моделей (вернее, у статистических тестов, которые для них используются), как у любого метода, есть свои ограничения. Вы узнаете, что это за ограничения и откуда они возникают. Графические методы диагностики, которыми мы будем пользоваться, универсальны для разных линейных моделей - больше практики поможет вам увереннее принимать решения. Разобравшись со всем этим, вы сможете написать на языке R полный скрипт для подбора, диагностики и представления результатов простой линейной регрессии.

Краткое введение в мир линейной алгебры

В этом модуле мы с вами погрузимся в самое сердце линейных моделей. Для этого вам придется изучить или вспомнить основы линейной алгебры. Мы обсудим разновидности матриц, способы их создания в R и основные операции с ними. Все это нам понадобится, чтобы разобраться, как устроена линейная регрессия изнутри. Вы узнаете, что такое модельная матрица, научитесь записывать уравнение линейной регрессии в виде матриц и находить его коэффициенты. Вы своими глазами увидите хэт-матрицу, которая позволяет получать предсказанные значения, и даже сможете ее вычислить вручную. Наконец, вы научитесь рассчитывать остаточную дисперсию, вариационно-ковариационную матрицу и использовать все это для того, чтобы строить доверительную зону регрессии. Потом эти знания помогут вам разобраться с устройством более сложных моделей: с дискретными предикторами, с другими распределениями остатков, с иным устройством вариационно-ковариационной матрицы.

Множественная линейная регрессия

Чаще всего связи между величинами устроены сложнее, чем это можно описать при помощи простой линейной регрессии. Множественная линейная регрессия используется, чтобы описать, как переменная-отклик зависит от нескольких предикторов. С появлением в модели множества предикторов у линейной регрессии появляется новое условие применимости - требование отсутствия мультиколлинеарности. В этом модуле вы узнаете, как можно выявить мультиколлинеарность и избежать ее. Наконец, нередко во множественных моделях переменных больше, чем это можно изобразить на плоскости, поэтому мы научим вас простым приемам, которые помогут создавать информативные графики даже в таком случае.

Сравнение линейных моделей

Множественные линейные модели подобны конструктору: более сложные модели можно разбирать на части и упрощать. Вы узнаете, как сравнение вложенных моделей при помощи частного F-теста используется при проверке значимости отдельных предикторов или их групп. Более сложные модели лучше описывают исходные данные, но избыточное усложнение опасно, т.к. такие модели начинают давать плохие предсказания на новых данных. При помощи частных F-тестов можно упрощать модели, постепенно исключая незначимые предикторы. Упрощенные модели легче использовать для интерпретации и представления результатов. Все, что вы успели узнать о линейной регрессии, вы сможете применить, выполнив проект по анализу данных, где нужно будет корректно построить оптимальную множественную линейную модель и представить ее результаты в отчете, написанном при помощи rmarkdown и knitr.

千万首歌曲。全无广告干扰。
此外,您还能在所有设备上欣赏您的整个音乐资料库。免费畅听 3 个月,之后每月只需 ¥10.00。
Apple 广告
声明:MOOC中国十分重视知识产权问题,我们发布之课程均源自下列机构,版权均归其所有,本站仅作报道收录并尊重其著作权益。感谢他们对MOOC事业做出的贡献!
  • Coursera
  • edX
  • OpenLearning
  • FutureLearn
  • iversity
  • Udacity
  • NovoEd
  • Canvas
  • Open2Study
  • Google
  • ewant
  • FUN
  • IOC-Athlete-MOOC
  • World-Science-U
  • Codecademy
  • CourseSites
  • opencourseworld
  • ShareCourse
  • gacco
  • MiriadaX
  • JANUX
  • openhpi
  • Stanford-Open-Edx
  • 网易云课堂
  • 中国大学MOOC
  • 学堂在线
  • 顶你学堂
  • 华文慕课
  • 好大学在线CnMooc
  • (部分课程由Coursera、Udemy、Linkshare共同提供)

© 2008-2022 CMOOC.COM 慕课改变你,你改变世界