s
19 708 Pages

Dans le domaine de la 'apprentissage machine, un caractéristique (Également connu avec le terme respectif Anglais caractéristique) Est une propriété privée et un phénomène mesurable observé.[1] Le choix des caractéristiques discriminantes, très instructifs et indépendants les uns des autres est une étape cruciale pour obtenir un algorithme efficace la reconnaissance de formes, classification et régression. La valeur d'une caractéristique Il est généralement fait sous forme numérique; Cependant, il y a des exceptions, comme dans la reconnaissance des formes syntaxiques (reconnaissance de motif syntaxique), Dans lequel les caractéristiques structurelles sont considérées comme instruments à cordes et graphiques. Le concept de « fonction » est liée à celle de variable explicative utilisé dans le domaine technique statistiques comme régression linéaire.

Les premières caractéristiques-ensemble, nous pouvons d'abord redondants et trop gros pour être géré efficacement. En conséquence, une étape préliminaire typique dans de nombreuses applications de 'apprentissage machine Elle consiste à sélection de caractéristiques, dans 'extraction de caractéristiques ou, plus généralement, dans la réduction de la dimensionnalité du soi-disant l'espace d'entrée ( "Espace d'entrée").

le vecteur de caractéristiques

Un ensemble de caractéristiques numériques peut être décrit, pour la commodité, par un vecteur caractéristique. Un exemple d'utilisation du vecteur de caractéristique est l'algorithme de perceptron, dans lequel il doit multiplier le vecteur pour le vecteur de poids , décider quelle classification en fonction du résultat de cette produit scalaire.[2]

D'autres méthodes de classification qui utilisent le vecteur caractéristique peut être k-voisins les plus proches et divers algorithmes dans le domaine de Les réseaux neuronaux artificiels, classification statistique et de la théorie bayésienne.

Exemples

Voici quelques exemples de fonctionnalités dans certaines applications d'apprentissage de la machine:

  • en Reconnaissance optique de caractères, une option peut consister noirs du nombre de pixels d'une histogramme le long d'une direction verticale ou horizontale, le nombre de trous internes, etc.
  • en reconnaissance vocale, caractéristiques pour la détection de phonème peut comprendre rapport signal / bruit, la longueur du son, filtres adaptés, et plus encore.
  • Dans les algorithmes de détection de le spam, une option peut consister en la présence ou l'absence de certains motifs dans l'en-tête (tête) De 'email, la langue utilisée, la fréquence des mots spécifiques, la correction grammaticale du texte, et ainsi de suite.
  • Le terme même "caractéristique« (Ou caractéristique) Il est également utilisé avec une signification presque similaire dans le domaine de la vision par ordinateur.

notes

  1. ^ (FR) Bishop, Christopher, Reconnaissance des formes et l'apprentissage de la machine, Berlin, Springer, 2006 ISBN 0-387-31073-8.
  2. ^ (FR) Avrim Blum, L'algorithme Perceptron (PDF) Carnegie Mellon University - Département des sciences informatiques, le 25 Janvier 2010. Récupéré le 2 Février 2017 (déposé 29 décembre 2016).