Comment l'analyse prédictive support de machine de vecteur prédit l'avenir

La machine à vecteurs de support (SVM) est un algorithme de classification de données analyse prédictive qui attribue de nouveaux éléments de données à l'une des catégories marquées. SVM est, dans la plupart des cas, un binaire classifier- il suppose que les données en question contient deux valeurs cibles possibles.

Une autre version de l'algorithme de SVM, multiclassent SVM, augmente SVM pour être utilisé comme classificateur sur un ensemble de données qui contient plus d'une catégorie (groupe ou catégorie). SVM a été utilisé avec succès dans de nombreuses applications telles que la reconnaissance d'image, le diagnostic médical, et l'analyse de texte.

Supposons que vous concevez un modèle d'analyse prédictive qui va automatiquement reconnaître et prédire le nom d'un objet dans une image. Ceci est essentiellement le problème de la reconnaissance d'image - ou, plus précisément, la reconnaissance du visage: Vous voulez que le classificateur de reconnaître le nom d'une personne dans une photo.

Eh bien, avant d'aborder ce niveau de complexité, d'examiner une version simplifiée du même problème: Supposons que vous avez des photos de différents morceaux de fruits et vous souhaitez que votre classificateur de prédire quel genre de fruit apparaît dans l'image. Supposons que vous avez seulement deux types de fruits: pommes et poires, un par image.

Étant donné une nouvelle image, vous souhaitez prédire si le fruit est une pomme ou une poire - sans regarder l'image. Vous voulez que le SVM pour classer chaque image comme pomme ou une poire. Comme avec tous les autres algorithmes, la première étape est de former le classificateur.




Supposons que vous avez 200 photos de pommes différentes, et 200 images de poires. L'étape d'apprentissage consiste à alimenter ces images pour le classificateur de sorte qu'il apprend ce une pomme ressemble et ce une poire ressemble. Avant d'entrer dans cette première étape, vous avez besoin pour transformer chaque image en une matrice de données, en utilisant (par exemple) le logiciel de statistiques R.

Une façon simple de représenter une image sous forme de nombres dans une matrice est de chercher des formes géométriques dans l'image (tels que des cercles, des lignes, des carrés, des rectangles ou des) ainsi que les positions de chaque instance de chaque forme géométrique. Ces chiffres peuvent également représenter des coordonnées de ces objets dans l'image, comme tracée dans un système de coordonnées.

Comme vous pouvez l'imaginer, représentant une image comme une matrice de nombres est pas exactement une tâche simple. Toute une zone distincte de la recherche est consacrée à la représentation de l'image.

Les spectacles suivants comment une machine à vecteurs de support peut prédire la classe d'un fruit (étiquetage mathématiquement que pomme ou poire), Sur la base de ce que l'algorithme a appris dans le passé.

image0.jpg

Supposons que vous avez converti toutes les images dans des matrices de données. Puis la machine à vecteurs de support prend deux entrées principales:

  • Précédent (formation) des données: Cet ensemble de matrices correspond à déjà vu des images de pommes et de poires.

  • Les nouvelles données (invisible) consiste en une image convertie en une matrice. Le but est de prédire automatiquement ce qui est dans l'image - une pomme ou une poire.

Le vecteur de support technique utilise une fonction mathématique, souvent appelé un fonction noyau qui est une fonction mathématique qui correspond aux nouvelles données à la meilleure image à partir des données de formation afin de prédire l'étiquette de l'image inconnue (de pomme ou de poire).

En comparaison à d'autres classificateurs, support vector machines produisent robustes, des prévisions précises, sont moins affectées par les données bruyants, et sont moins enclins à overfitting. Gardez à l'esprit, cependant, que le soutien technique des vecteurs sont les plus appropriés pour la classification binaire - lorsque vous avez seulement deux catégories (comme la pomme ou de poire).


» » » » Comment l'analyse prédictive support de machine de vecteur prédit l'avenir