线性核 | ReConcept Lab

Hook problem：从不升维的基线开始

在加入弯曲边界或局部邻域之前，先问一个问题：原始坐标本身够不够用？

**线性核（linear kernel）**就是不发明新特征的核函数。

不升维：原空间相似度线性核就是现有坐标中的点积。

从锚点 A 出发的线性核
点	点积	距离平方	K(A, z)
A	2	0	2
B	3	1	3
C	1	5	1
D	-2	10	-2

如果两个向量方向相近，而且长度也有意义，那么点积就是一个合理的相似度分数。

痛点出现在原始对齐不是重点的时候：类似 XOR 的交互、环形结构、局部小岛，都需要超出直线几何的表达。

K(x,z)=x^Tz

如果输入有 d 个特征，直接计算需要 O(d) 时间。这里的特征映射是恒等映射，所以 phi(x)=x。

核相似度实验台

x * z: 保留原始坐标，度量普通的方向对齐。只影响 RBF 的衰减速度；其他核函数保持固定参数。

把每个点都和选中的锚点比较。注意每种核函数对“接近”的理解不同。

A -> A2

相似度; 点积 2, 距离平方 0

A -> B3

相似度; 点积 3, 距离平方 1

A -> C1

相似度; 点积 1, 距离平方 5

A -> D-2

相似度; 点积 -2, 距离平方 10

function linearKernel(x: number[], z: number[]) {
  return x.reduce((sum, value, index) => sum + value * z[index], 0);
}

核函数学习路径特征映射引出核函数；不同核函数选择不同的相似度含义。

特征映射

基础思想

核函数

基础思想

线性核

具体选择

多项式核

具体选择

RBF 核

具体选择

Sigmoid 核

具体选择

多项式核从同一个点积出发，把它的仿射形式提升到某个次数。RBF 核则离开点积对齐，改用距离衰减。