Klasyfikacja statystyczna

Klasyfikacja statystyczna – rodzaj algorytmu statystycznego, który przydziela obserwacje statystyczne do klas, bazując na atrybutach (cechach) tych obserwacji.

Definicja formalna

Dla danego zbioru danych trenujących { ( x 1 , y ) , , ( x n , y ) } {\displaystyle \{(\mathbf {x_{1}} ,y),\dots ,(\mathbf {x_{n}} ,y)\}} znaleźć klasyfikator h : X Y , {\displaystyle h:{\mathcal {X}}\to {\mathcal {Y}},} który przydziela obiektowi x X {\displaystyle \mathbf {x} \in {\mathcal {X}}} klasę y Y . {\displaystyle y\in {\mathcal {Y}}.} Przykładowo, jeśli problem dotyczy filtrowania spamu, wówczas x i {\displaystyle \mathbf {x_{i}} } to pewna reprezentacja wiadomości, a y {\displaystyle y} to „spam” lub „nie spam”.

Przykłady klasyfikatorów:

Zobacz też

  • uczenie maszynowe
  • uczenie nadzorowane
  • uczenie nienadzorowane