机器学习是什么
机器学习就是机器自动找一个函数,人类的数据是输入,符合人类的需要是输出。
函数的分类
- 回归(Regression):函数的输出是一个数值(标量)。
例如,PM2.5,输入是天气相关的数据,输出是一个关于PM2.5的数值。
- 分类(Classification):函数的输出是一个类别(选择题)
例如,邮件过滤系统,就是一个分类问题。
- 结构化学习(Structure Learning):又叫做生成式学习(Generative Learning),生成带有结构的东西,如视频,图片,语音,句子。
那么Chatgpt属于哪一类呢?
- 从工作原理上看,GPT只是在做一个选择文字的游戏,所以可以看成是分类。
- 从用户角度看,GPT虽然是一个字一个字的挑选回答,但最终的生成了一个完整的句子,所以可以看成是生成式学习。或者所GPT是把生成式学习拆解成多个分类问题。
机器学习找出函数的三步
找出函数的前置任务与技术无关,取决于自己想做的应用。输入是什么,输出是什么。
1.设定范围
具体而言,我们需要找出一个函数,以Linear Models为例:
$$
y=b+wx_1
$$
其中:
- $y$是我们需要预测的东西
- $x_1$是我们已知的信息
- w和b是两个未知参数,它们分别代表“weight(权重矩阵)”和“bias(偏差)”,是需要机器从数据中找出的参数。而这些数据从哪来呢?这就需要我们根据任务领域的知识和个人的经验去划定范围,也就是Domain knowledge。
这个候选函数的集合,也就是机器学习中的模型(Model)。
深度学习(Deep Learning)中类神经网络的结构(CNN,RNN,Transformer)指的就是不同的候选函数的集合。