询问入门机器学习的学习路径,以吴恩达的课程为例,进行整理

最近终于有时间继续学习机器学习了,但是呢,我是一个想白嫖的人,想请大家为这个课程理一下学习思路,这么多的课根本不想看,也不知道他想讲什么

[中英字幕]吴恩达机器学习系列课程_哔哩哔哩_bilibili


我记得王垠说过,机器学习就是个拟合数据的过程
既然这样,其他的一堆看不懂的教程就可以当作辅助拟合数据的形式了
我想入坑机器学习之前,还是先理一下学习思路吧


ps: Introduction to Machine Learning | JuliaAcademy
这个网站注册不了,那个Sign Up的按钮一直是灰色的

这个网站挂梯子没问题的

我不用梯子也可以,是不是你的dns被污染了。但是注册得谷歌人机验证,没有梯子不行。

我已经弄好了 :grin:

看标题:第一章介绍、第二章第三章线性代数、第四章看上去是多元优化、第五章编程基础、后面就开始将具体的算法吧。

时间充足就慢慢看呗,再自己实现一下算法,只用 blas 的那种,甚至还可以拆开来去看对应的具体课程。

只是玩一玩或者需要应用就去找现成的模型吧,有些还有商业的 API 可用。

他这个偏理论一点。我个人可能更喜欢 https://zh.gluon.ai/ 这种和代码结合更紧密的。

推荐李宏毅老师的课,讲的也非常好,非常细致,每种算法都会举例,也会讲数学推导过程。是台湾人,比较容易听懂,吴恩达老师的课感觉有些枯燥,我看的coursera版的,可能是专门录的,而且也比较老,用的是octave,有点像念ppt了,李宏毅老师讲的还是很有趣的用的是py跟keras,总之推荐。
下面是链接:

看不懂英文,有没有中文的目录? :grin:

emmmm专业英文还是要会一点吧,李宏毅老师讲课的时候也会夹杂一些专业的英文词汇,ppt也是英文,如果一点都不会的话也很难听懂

四级还没过呢 :rofl:

这个能用Julia翻译一遍吗? :yum:

3.2.1. 生成数据集
我们构造一个简单的人工训练数据集,它可以使我们能够直观比较学到的参数和真实的模型参数的区别。设训练数据集样本数为1000,输入个数(特征数)为2。给定随机生成的批量样本特征\boldsymbol{X} \in \mathbb{R}^{1000 \times 2},我们使用线性回归模型真实权重\boldsymbol{w} = [2, -3.4]^\top和偏差b = 4.2,以及一个随机噪声项\epsilon来生成标签

\boldsymbol{y} = \boldsymbol{X}\boldsymbol{w} + b + \epsilon,
其中噪声项\epsilon服从均值为0、标准差为0.01的正态分布。噪声代表了数据集中无意义的干扰。下面,让我们生成数据集。

In [2]:
num_inputs = 2
num_examples = 1000
true_w = [2, -3.4]
true_b = 4.2
features = nd.random.normal(scale=1, shape=(num_examples, num_inputs))
labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b
labels += nd.random.normal(scale=0.01, shape=labels.shape)

顺便问一下,线性回归的从零开始怎么用Julia写出来(白嫖的眼神)