课程概况
欢迎大家!这门课将採用英文投影片配合华文的教学讲解,我们希望能藉这次华文教学的机会,将机器学习介绍给更多华人世界的同学们。课程中使用的英文投影片不会使用到艰深的英文,如果你能了解以下两段的课程简介,你应该也可以了解课程所使用的英文投影片。
Machine learning is the study that allows computers to adaptively improve their performance with experience accumulated from the data observed. Our two sister courses teach the most fundamental algorithmic, theoretical and practical tools that any user of machine learning needs to know. This second course of the two would focus more on algorithmic tools, and the other course would focus more on mathematical tools.
课程大纲
周1
完成时间为 2 小时
第九講: Linear Regression
weight vector for linear hypotheses and squared error instantly calculated by analytic solution
4 个视频 (总计 62 分钟), 4 个阅读材料
周2
完成时间为 1 小时
第十講: Logistic Regression
gradient descent on cross-entropy error to get good logistic hypothesis
4 个视频 (总计 65 分钟)
周3
完成时间为 1 小时
第十一講: Linear Models for Classification
binary classification via (logistic) regression; multiclass classification via OVA/OVO decomposition
4 个视频 (总计 59 分钟)
周4
完成时间为 2 小时
第十二講: Nonlinear Transformation
nonlinear model via nonlinear feature transform+linear model with price of model complexity
4 个视频 (总计 59 分钟), 1 个测验
周5
完成时间为 1 小时
第十三講: Hazard of Overfitting
overfitting happens with excessive power, stochastic/deterministic noise and limited data
4 个视频 (总计 49 分钟)
周6
完成时间为 1 小时
第十四講: Regularization
minimize augmented error, where the added regularizer effectively limits model complexity
4 个视频 (总计 65 分钟)
周7
完成时间为 1 小时
第十五講: Validation
(crossly) reserve validation data to simulate testing procedure for model selection
4 个视频 (总计 56 分钟)
周8
完成时间为 1 小时
第十六講: Three Learning Principles
be aware of model complexity, data goodness and your professionalism
预备知识
我们希望修课的同学对於基本的微分、向量与矩阵运算、及机率的工具有所了解。有些作业会需要写作或执行一些程式,所以我们建议修课的同学能在你所熟悉的平台上有一些程式写作的背景。我们假设修课的同学们已经学过「机器学习基石」或同等课程。
参考资料
这门课的录影课程及投影片应该足以帮大家了解所有的内容。有关开课前的预备知识,我们推荐有兴趣的同学们阅读 Learning from Data 一书,该书包含了本课程所需的大部份背景知识。