Comment appliquer les grappes de colonies dans l'analyse prédictive

Un exemple naturel du groupe d'auto-organisation, vous pouvez appliquer dans le comportement de l'analyse prédictive est une colonie de fourmis de chasse pour la nourriture. Les fourmis optimiser collectivement leur piste afin qu'elle prend toujours le chemin le plus court possible d'une cible de nourriture.

Même si vous essayez de perturber une colonie de marche de fourmis et de les empêcher de se rendre à la cible de la nourriture qu'ils obtiennent sur les rails rapidement et (à nouveau) trouver le chemin le plus court possible de la cible de la nourriture, chacun d'eux en évitant les mêmes obstacles tout en recherchant aliments. Cette uniformité de comportement est possible parce que tous les dépôts de fourmis une traînée de phéromones sur le terrain.

Envisager une armée de fourmis ralenti dans leur nid. Quand ils commencent à chercher de la nourriture, ils ont absolument aucune information sur l'endroit où le trouver. Ils marchent au hasard jusqu'à une fourmi individuelle de denrées alimentaires se trouve maintenant la fourmi chanceux (appeler Ant X) doit communiquer sa découverte au reste des fourmis - et pour ce faire, il doit trouver son chemin de retour au nid.

Heureusement, Ant X produisait ses propres phéromones tout le temps, il a été à la recherche d'origine alimentaire, il peut suivre son propre chemin de phéromones au nid. Sur son chemin de retour au nid, à la suite de sa propre piste de phéromone, Ant X met plus de phéromones sur la même piste.

En conséquence, le parfum sur la piste de Ant X sera la plus forte parmi tous les sentiers »les autres fourmis. La piste la plus forte de phéromones va attirer tous les autres fourmis qui sont toujours à la recherche de nourriture. Ils suivent l'odeur forte. Comme plus de fourmis rejoindre la piste de Ant X, ils ajoutent plus de phéromones pour it-le parfum devient plus forte. Très bientôt, toutes les autres fourmis ont une forte odeur de suivre.

Si plusieurs fourmis ont découvert la même source de nourriture, les fourmis qui ont eu le plus court chemin feront plus de voyages par rapport aux fourmis qui suivent des chemins plus longs - donc plus de phéromones seront produites sur le chemin le plus court. La relation entre le comportement individuel et collectif est un exemple éclairant naturelle.




Chaque point représente un document. Supposons que les points noirs sont des documents sur l'analyse prédictive et les points blancs sont des documents sur l'anthropologie. Les points représentant les différents types de documents sont distribués au hasard dans la grille de cinq cellules.

“ Ants ” sont déployés de façon aléatoire dans la grille pour rechercher des documents similaires. Chaque cellule avec une valeur en elle représente une instance d'un “. Phéromone ” Utilisation de la matrice de document, chaque cellule de “ phéromone ” La valeur est calculée à partir du document correspondant.

image0.jpg

Bon, comment l'intelligence collective d'une colonie de fourmis produire un modèle pour le clustering efficacement les données? La réponse réside dans une simple analogie: Les fourmis sont à la recherche de nourriture dans leur environnement, autant que nous sommes à la recherche pour les clusters dans un ensemble de données - à la recherche de documents similaires au sein d'un grand ensemble de documents.

Considérons un ensemble de données de documents que vous souhaitez organiser par sujet. Documents similaires seront regroupés dans le même cluster. Voici où la colonie de fourmis peut fournir des conseils sur la façon de groupe documents similaires.

Imaginez un (2D) grille bidimensionnelle où vous pouvez représenter des documents sous forme de points. La grille 2D est divisée en cellules. Chaque cellule a un “ phéromone ” (valeur) qui lui est associé. En bref, le “ phéromone ” La valeur la distingue de chaque document dans une cellule donnée.

Les points sont initialement répartis de manière aléatoire - et chaque point de la grille représente un document unique. La prochaine étape consiste à déployer d'autres points de façon aléatoire sur la grille 2D, simulant la recherche de la colonie de fourmis pour la nourriture dans son environnement. Ces points sont d'abord dispersées dans la même grille 2D avec les documents.

Chaque nouveau point ajouté à la grille représente une fourmi. Ceux “ fourmis, ” souvent désigné dans l'algorithme fourmi colonie agents, se déplacent dans la grille 2D. Chaque “ ant ” seront soit ramasser ou déposer les autres points (documents), selon l'endroit où les meilleurs documents appartiennent. Dans cette analogie, la “ la nourriture ” prend la forme de documents suffisamment semblables peuvent être regroupées.

Un “ ant ” promenades au hasard dans la grille- si elle rencontre un document, il peut effectuer une des deux actions: ramasser ou déposer. Chaque cellule a un “ phéromone intensité ” qui indique comment le document est semblable aux autres documents (points) résidant près du document en question - celui d'une “ ant ” est sur le point soit ramasser ou déposer.

On notera que le “ ant ” dans Cell 3 sera de récupérer le document en noir parsemé parce que le blanc “ phéromone ” valeur est dominating- et passer à une cellule où la valeur est proche (similaire) pour ce qui est dans la cellule 4 (plusieurs points noirs). La recherche continue itération jusqu'à ce que les grappes se forment.

image1.jpg

En effet, le “ ant ” déplace documents d'une cellule à l'autre pour former des grappes en effectuant l'une des deux seules actions: ramasser un document ou de faire tomber un document.

Quand le “ fourmis ” commencé à se déplacer de manière aléatoire sur la grille, à la rencontre d'un point (document) entraîne la “ ant ” ramasser un document à partir de sa cellule actuelle, se déplaçant avec elle, et en le déposant dans une cellule dans laquelle il avait une similitude suffisante pour répondre.

Comment un “ ant ” déterminer la meilleure cellule pour déposer un document? La réponse est que les valeurs dans les cellules agissent comme “ phéromones ” - Et chaque cellule de la grille 2D contient une valeur numérique qui peut être calculé d'une manière qui représente un document dans la cellule.

Rappelez-vous que chaque document est représenté comme un ensemble de nombres ou un vecteur de valeurs numériques. La “ l'intensité de la phéromone ” (la valeur numérique) augmente lorsque plusieurs documents sont déposés dans la cellule - et cette valeur diminue si les nombres qui représentent les documents sont déplacés hors de la cellule.


» » » » Comment appliquer les grappes de colonies dans l'analyse prédictive