首页 > 机器学习与高维信息检索 - Note 6 - 核，核方法与核函数（Kernels and the Kernel Trick）

机器学习与高维信息检索 - Note 6 - 核，核方法与核函数（Kernels and the Kernel Trick）

Note 6 核，核方法与核函数

到目前为止，我们所讨论的机器学习算法的成功都依赖于对输入数据分布的假设。例如，PCA的效果越好，数据围绕线性子空间分布。或者在线性判别分析中，我们假设类的高斯分布，甚至有相同的协方差矩阵。

为了更好地考虑输入数据的其他更复杂的分布，扩展方法的一种方式是采用所谓的核方法。它允许概括所有基本上只有标准内积作为输入数据的方法。

更确切地说，考虑一个ML算法，其输入数据可以是无标签的，即 $x1,…,xnmathbf{x}_{1}, ldots, mathbf{x}_{n}$ 或有标签的，即 $(x1,y1),…,(xn,yn)left(mathbf{x}_{1}, mathbf{y}_{1} ight), ldots,left(mathbf{x}_{n}, mathbf{y}_{n} ight)$ 。此外，假设该算法实际上只使用了输入数据的 $⟨xi,xj⟩:=xi⊤xjleftlanglemathbf{x}_{i}, mathbf{x}_{j} ight angle:=mathbf{x}_{i}^{ op} mathbf{x}_{j}$ 。然后，将 $⟨xi,xj⟩leftlanglemathbf{x}_{i}, mathbf{x}_{j} ight angle$ 替换为某个函数 $κ(xi,xj)kappaleft(mathbf{x}_{i}, mathbf{x}_{j} ight)$ ，该函数是内积的适当概括（即核），称为核方法，参见图6.1。由此产生的学习方法通常被命名为 "核 "一词的前缀。这个技巧通常可以将基于数据分布的线性假设的方法扩展到更复杂的非线性分布。

在这里插入图片描述

图6.1：核方法的说明。用核代替机器学习算法中的标准内积，以获得该方法的 "核 "版本。

Kernel method $^{[1]}$

[1] 这部分来自于wikipedia，对于核有更详细的说明与介绍。

核方法可以被认为是基于实例的学习器：它们不是学习一些与输入特征相对应的固定参数集，而是 "记住"第 $i$ 个训练实例 $_{i},y_{i})$ ，并为其学习相应的权重 $w_{i}$ 。对未标记的输入，即那些不在训练集中的输入的预测，是通过应用一个相似性函数 $k$ ，称为核。核是在未标记的输入 $x^{'}$ 和每个训练输入 $_{i}$ 之间的相似度函数，它衡量它们之间的相似性。例如，一个核的二元分类器通常计算相似性的加权和

$y^=sgn⁡∑i=1nwiyik(xi,x′),{hat {y}}=operatorname {sgn} sum _{i=1}^{n}w_{i}y_{i}k(mathbf {x} _{i},mathbf {x'} ),$

其中

$y^∈{−1,+1}{hat {y}}in {-1,+1}$ 是核化二元分类器对未标记的输入的预测标签。
$x^{'}$ 其隐藏的真实标签y是我们感兴趣的。
$k : X \times X \to R$ 是衡量任何一对输入 $x, x^{'} \in X;$ 之间相似性的内核函数。
$\sum$ 的范围是分类器训练集中的 $n$ 个已标记的例子， $_{i},y_{i})}_{i=1}^{n}$ ，其中 $yi∈{−1,+1}y_{i} in {-1,+1}$ 。
$wi∈Rw_{i}in mathbb {R}$ 是训练实例的权重，由学习算法决定。
符号函数 ${sgn}$ 决定了预测的分类 $y^{hat {y}}$ 的结果是正还是负。

核分类器早在20世纪60年代就被描述过，当时发明了核感知器。随着支持向量机（SVM）在20世纪90年代的流行，核分类器的地位大为提高，当时SVM被发现在手写数字识别等任务上可以与神经网络相竞争。

因此，核的定义如下。它概括了标准的内积。

Definition 6.1

一个（半正定）核是一个函数 $mathbb{R}^{p} imes mathbb{R}^{p} ightarrow mathbb{R}$

机器学习与高维信息检索 - Note 6 - 核，核方法与核函数（Kernels and the Kernel Trick）

Note 6 核，核方法与核函数

Kernel method $^{[1]}$

更多相关：

机器学习与高维信息检索 - Note 5 - (深度）前馈神经网络（(Deep) Feedforward Neural Networks）及基于CVXOPT的相关实例

excel高级函数_PowerQuery 进阶之 M 函数学习

python从0开始学编程课件_小白从零开始学编程(三)--python基本概念

python 函数递归一次增加一次变量_python3--函数(函数，全局变量和局部变量，递归函数)...

python深度神经网络量化_基于Python建立深度神经网络！你学会了嘛？

mysql 字段加减_MySQL中你必须了解的函数

机器学习与高维信息检索 - Note 6 - 核， 核方法与核函数（Kernels and the Kernel Trick）

Note 6 核， 核方法与核函数

Kernel method[1]^{[1]}[1]

更多相关：

机器学习与高维信息检索 - Note 5 - (深度）前馈神经网络（(Deep) Feedforward Neural Networks）及基于CVXOPT的相关实例

excel高级函数_PowerQuery 进阶之 M 函数学习

python从0开始学编程课件_小白从零开始学编程(三)--python基本概念

python 函数递归一次增加一次变量_python3--函数(函数，全局变量和局部变量，递归函数)...

python深度神经网络量化_基于Python建立深度神经网络！你学会了嘛？

mysql 字段加减_MySQL中你必须了解的函数

机器学习与高维信息检索 - Note 6 - 核，核方法与核函数（Kernels and the Kernel Trick）

Note 6 核，核方法与核函数

Kernel method $^{[1]}$