最近放了一个长假,计划系统地学习下机器学习的基本知识,途径主要是看andrew ng大牛的斯坦福大学公开课-机器学习课程视频,当然在看的过程中为了加深理解,会记下笔记,此篇为第一篇笔记。

机器学习的定义

非正式定义:

Arthur Samuel (1959). Machine Learning:
Field of study that gives computers the ability to learn without being explicitly programmed.
在不直接针对问题进行编程的情况下赋予计算机学习能力的一个研究领域。

更现代的定义:

Tom Mitchell (1998). Well-posed Learning Problem:
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
对于一个计算机程序来说,给它一个任务T和一个性能测量方法P,如果在经验E的影响下,P对T的测量结果得到了改进,那么就说该程序从E中学习。

课程的4个部分

监督学习(Unsuperized Learning)

我们在"监督"问题的算法,这里给算法提供了一组"标准答案",之后我们希望算法去学习标准输入和标准答案之间的联系,以尝试对于我们的其他输入给我们提供更为标准的答案。

  • 预测Portland Oregon地区房屋价格,需要预测的变量是连续的 。(回归问题)
  • 预测一个肿瘤是否为恶性,这里算法处理的是一些离散值(分类问题)
  • 把数据映射到无限维空间(支持向量机)

学习理论(Learning Theory)

学习理论分析为什么学习型算法是有效的,这样我们才可以让算法尽可能高效地工作。

  • 通过定理证明来找出什么时候你能达到高的精度
  • 了解什么样的算法能很好地近似不同的函数
  • 试图了解一些诸如需要多少训练数据这样的问题

学习理论可以使人能够真正地将机器学习的理念应用到解决实际问题当中。

无监督学习(Unsuperized Learning)

给一组数据,不告诉关于数据的任何正确答案,然后算法在这组数据中寻找一些有趣的结构。

  • 聚类问题将数据聚成几类
  • 按照基因在试验中体现出的形状对这些单独的基因进行分组
  • 聚类算法来进行图像处理,对像素进行聚类
  • 用图像聚类的结果创建这个世界的3D模型
  • 计算机集群组织、社会网络分析、市场划分、航天数据的分析、鸡尾酒会问题
  • 文本处理、理解功能分级和机械数据(ICA算法)

强化学习(Reinforcement Learning)

用在你不需要进行一次决策的情形中,你通常会在一段时间内做出一系列的决策。在强化学习背后的基本概念是一个称为回报函数的概念。强化学习的关键是需要找到一种方式来定义一个好的行为和一个坏的行为,之后就是需要一个学习型算法来尽可能地获得更多的回报和更少的惩罚。

  • 机器人领域
  • 网页爬取