1. Terminology(术语)

mlxxhg.png

  1. Training set:数据集,用于训练模型的数据

  2. x:input,feature

  3. y:output,target

  4. m:训练样本数

  5. (x, y):单个训练样本

  6. i:训练样本的下标

2. Linear Regression(线性回归)

mlleaner.pngLinear regression(线性回归)实际上就是函数:f(x) = wx+b,其在直角坐标系上为一条直线。Linear regression又叫Univariate linear regression,意思是只有一个variable 的函数。

2.1 Terminology

  1. w,b: parameters(参数),coefficients(系数),weights(权重)

  2. y-hat: 预测值

  3. w: slope(斜率)

  4. b: y-intercept(y截距)

2.2 w,b对线性回归的影响

mllinearwb.png

3. Cost Function(代价函数)

mlcostfunciton.png

3.1 Terminology

  1. Cost Function: Squard error cost function(平方差代价函数)

  2. J(w,b) = \frac{1}{2m} \sum_{i=1}^{m} \left (x^{(i)}) - y^{(i)} \right)^2 :每个预测值和目标值的平方差累加之后除以m(样本数),再除以2是为了让结果更加规整,无其他意义。

3.2 线性回归的目标:找出能使代价函数J(W)最小的w和b

ml2321.png

3.3 可视化代价函数

ml233.png