I maskinindlæring er kernen til radial basisfunktion eller RBF-kerne en populær kernefunktion, der bruges i forskellige kerneliserede indlæringsalgoritmer. Især bruges det almindeligt til klassificering af understøttelsesvektormaskiner .
RBF-kernen på to prøver x og x ' , repræsenteret som funktionsvektorer i noget inputrum , er defineret som
K
(
x
,
x
′
)
=
eksp
(
-
‖
x
-
x
′
‖
2
2
σ
2
)
{\ displaystyle K (\ mathbf {x}, \ mathbf {x '}) = \ exp \ left (- {\ frac {\ | \ mathbf {x} - \ mathbf {x'} \ | ^ {2}} {2 \ sigma ^ {2}}} \ højre)}
‖
x
-
x
′
‖
2
{\ displaystyle \ textstyle \ | \ mathbf {x} - \ mathbf {x '} \ | ^ {2}}
kan genkendes som den kvadratiske euklidiske afstand mellem de to funktionsvektorer. er en gratis parameter. En ækvivalent definition involverer en parameter :
σ
{\ displaystyle \ sigma}
γ
=
1
2
σ
2
{\ displaystyle \ textstyle \ gamma = {\ tfrac {1} {2 \ sigma ^ {2}}}}
K
(
x
,
x
′
)
=
eksp
(
-
γ
‖
x
-
x
′
‖
2
)
{\ displaystyle K (\ mathbf {x}, \ mathbf {x '}) = \ exp (- \ gamma \ | \ mathbf {x} - \ mathbf {x'} \ | ^ {2})}
Da værdien af RBF-kernen falder med afstanden og varierer mellem nul (i grænsen) og en (når x = x ' ), har den en klar fortolkning som et lighedsmål . Kernens funktionsrum har et uendeligt antal dimensioner; for dens udvidelse er:
σ
=
1
{\ displaystyle \ sigma = 1}
eksp
(
-
1
2
‖
x
-
x
′
‖
2
)
=
eksp
(
2
2
x
⊤
x
′
-
1
2
‖
x
‖
2
-
1
2
‖
x
′
‖
2
)
=
eksp
(
x
⊤
x
′
)
eksp
(
-
1
2
‖
x
‖
2
)
eksp
(
-
1
2
‖
x
′
‖
2
)
=
∑
j
=
0
∞
(
x
⊤
x
′
)
j
j
!
eksp
(
-
1
2
‖
x
‖
2
)
eksp
(
-
1
2
‖
x
′
‖
2
)
=
∑
j
=
0
∞
∑
∑
n
jeg
=
j
eksp
(
-
1
2
‖
x
‖
2
)
x
1
n
1
⋯
x
k
n
k
n
1
!
⋯
n
k
!
eksp
(
-
1
2
‖
x
′
‖
2
)
x
′
1
n
1
⋯
x
′
k
n
k
n
1
!
⋯
n
k
!
{\ displaystyle {\ begin {alignat} {2} \ exp \ left (- {\ frac {1} {2}} \ | \ mathbf {x} - \ mathbf {x '} \ | ^ {2} \ right ) & = \ exp ({\ frac {2} {2}} \ mathbf {x} ^ {\ top} \ mathbf {x '} - {\ frac {1} {2}} \ | \ mathbf {x} \ | ^ {2} - {\ frac {1} {2}} \ | \ mathbf {x '} \ | ^ {2}) \\ & = \ exp (\ mathbf {x} ^ {\ top} \ mathbf {x '}) \ exp (- {\ frac {1} {2}} \ | \ mathbf {x} \ | ^ {2}) \ exp (- {\ frac {1} {2}} \ | \ mathbf {x '} \ | ^ {2}) \\ & = \ sum _ {j = 0} ^ {\ infty} {\ frac {(\ mathbf {x} ^ {\ top} \ mathbf {x' }) ^ {j}} {j!}} \ exp \ left (- {\ frac {1} {2}} \ | \ mathbf {x} \ | ^ {2} \ right) \ exp \ left (- {\ frac {1} {2}} \ | \ mathbf {x '} \ | ^ {2} \ right) \\ & = \ sum _ {j = 0} ^ {\ infty} \ sum _ {\ sum n_ {i} = j} \ exp \ left (- {\ frac {1} {2}} \ | \ mathbf {x} \ | ^ {2} \ right) {\ frac {x_ {1} ^ {n_ {1}} \ cdots x_ {k} ^ {n_ {k}}} {\ sqrt {n_ {1}! \ Cdots n_ {k}!}}} \ Exp \ left (- {\ frac {1} { 2}} \ | \ mathbf {x '} \ | ^ {2} \ right) {\ frac {{x'} _ {1} ^ {n_ {1}} \ cdots {x '} _ {k} ^ {n_ {k}}} {\ sqrt {n_ {1}! \ cdots n_ {k}!}}} \ end {alignat}}}
Tilnærmelser
Fordi supportvektormaskiner og andre modeller, der anvender kernetricket , ikke skaleres godt til et stort antal træningseksempler eller et stort antal funktioner i inputrummet, er der blevet introduceret flere tilnærmelser til RBF-kernen (og lignende kerner). Disse tager typisk form af en funktion z, der kortlægger en enkelt vektor til en vektor med højere dimensionalitet, hvilket er tilnærmelsesvis kernen:
⟨
z
(
x
)
,
z
(
x
′
)
⟩
≈
⟨
φ
(
x
)
,
φ
(
x
′
)
⟩
=
K
(
x
,
x
′
)
{\ displaystyle \ langle z (\ mathbf {x}), z (\ mathbf {x '}) \ rangle \ approx \ langle \ varphi (\ mathbf {x}), \ varphi (\ mathbf {x'})) \ rangle = K (\ mathbf {x}, \ mathbf {x '})}
hvor er den implicitte kortlægning indlejret i RBF-kernen.
φ
{\ displaystyle \ textstyle \ varphi}
En måde at konstruere en sådan z på er at tilfældigt prøve fra Fourier-transformation af kernen. En anden tilgang bruger Nyström-metoden til at tilnærme den egentlige sammensætning af Gram-matrix K ved kun at bruge en tilfældig prøve af træningssættet.
Se også
Referencer
<img src="https://en.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">