Comment utiliser oiseaux grappes de troupeau dans l'analyse prédictive

Imaginez flocage le comportement des oiseaux comme un modèle pour les données d'analyse prédictive de votre entreprise. Chaque élément de données correspond à un seul oiseau dans le flocages une application visuelle appropriée peut montrer le troupeau en action dans un espace visuel imaginaire.

Votre jeu de données correspond à la volée. Le comportement de flocage naturel correspond à des modèles de données qui pourraient autrement passer à découvrir. Le but est de détecter des essaims (clusters de données) entre les oiseaux grégaires (éléments de données).

Flocage comportement a été utilisé dans des applications réelles telles que les opérations de sauvetage sur la base robotique-et animation par ordinateur. Par exemple, le producteur du film Batman Returns le comportement de flocage mathématique généré pour simuler des essaims de chauve-souris et les troupeaux de manchots.

L'utilisation de flocage comportement comme une technique d'analyse prédictive - l'analyse des données d'une entreprise que les troupeaux d'éléments de données similaires - est basée sur la dynamique derrière le comportement flocage tel qu'il apparaît dans la nature.

Flocage comportement des oiseaux, les poissons, les mouches, abeilles, et les fourmis est une auto-organisation Système- les individus ont tendance à se déplacer en fonction à la fois de leur environnement et les individus voisins.

Dans un troupeau d'oiseaux, chaque oiseau applique trois règles principales tout en flocage:

  • Séparation maintient un oiseau en dehors de ses plus proches compagnons de troupeau.

  • Alignement permet un oiseau de se déplacer le long de la même rubrique moyenne que celle de ses compagnons troupeau.

  • Cohésion maintient l'oiseau dans le troupeau local.




Chaque oiseau dans un troupeau se déplace en fonction de ces règles. Est un oiseau troupeau copains sont des oiseaux trouvés à une certaine distance de l'oiseau, et à une certaine distance l'une de l'autre. Pour éviter une collision entre les oiseaux, une distance minimale doit être kept- il peut également être définie mathématiquement. Telles sont les règles qui orchestrent affluent behavior- les utiliser pour analyser des données est une étape naturelle.

Considérons un ensemble de données en ligne des utilisateurs de réseaux sociaux. Regroupement de données peut identifier les communautés sociales qui partagent les mêmes intérêts. Identifier les communautés sociales en réseau social est outil précieux qui peut transformer la façon dont les organisations pensent, agissent, exploiter et gérer leurs stratégies de marketing.

Comment obtenez-vous un ensemble de données d'utilisateurs de réseaux sociaux? Eh bien, certaines des données et des outils sont déjà disponibles: grands réseaux sociaux et sites de micro-blog, tels que Facebook et Twitter fournissent une interface de programmation d'application (API) qui vous permet de développer des programmes qui peuvent obtenir des données publiques publiées par les utilisateurs.

Ces API offertes par Twitter sont désignés comme Twitter streaming API. Ils viennent dans trois principaux types: public, utilisateur, et les ruisseaux du site:

  • Ruisseaux publics permettre à un utilisateur de collecter des tweets publics sur un sujet ou un utilisateur spécifique, ou à appuyer une vue de l'analyse.

  • Flux de l'utilisateur permettre à un utilisateur de collecter des tweets qui sont accessibles par le compte de l'utilisateur.

  • Ruisseaux du site sont pour les serveurs à grande échelle qui se connectent à Twitter au nom de beaucoup d'utilisateurs.

Maintenant, supposons que vous utilisez un tel programme pour télécharger les données des utilisateurs et de l'organiser dans un format tabulaire tels que la matrice montré. Il montre une matrice simple qui enregistre les interactions en ligne d'amis en ligne de Zach plus de deux semaines différentes. Cette base de données se compose de sept éléments et sept caractéristiques. Les caractéristiques comme indiqué dans la colonne de la table sont le nombre d'interactions entre chaque membre et les autres membres.

Il existe de nombreuses façons d'appliquer le comportement de l'oiseau-affluent pour découvrir les clusters dans les grands ensembles de données. L'une des variantes les plus récentes est le Troupeau du chef algorithme de clustering machine d'apprentissage, inspiré par la découverte des chefs d'oiseaux dans les espèces de pigeons. L'algorithme prédit éléments de données susceptibles d'entraîner un autre groupe d'objets de données.

Un leader est attribué, puis les initiés de leader et conduit le comportement flocage. Au cours de l'algorithme, les dirigeants peuvent devenir des disciples ou aberrantes. En substance, cet algorithme fonctionne d'une manière qui respecte les règles de la «survie du plus fort."

The Flock par l'algorithme de leader a été introduit par Abdelghani Bellaachia et Anasse Bari en "Flock par Leader: Un algorithme Clustering machine Roman d'apprentissage inspirés par la biologie», publié comme un chapitre dans la procédure des progrès de la conférence 2012 Swarm Intelligence.

Le tableau suivant montre une manière possible de représenter les données générées par les échanges sociaux en ligne plus de deux semaines. Il montre que Zach interagi 56 fois avec Kellie et cinq fois avec Arthur.

Membre du Réseau socialInteractions avec JohnInteractions avec MikeInteractions avec ZachInteractions avec EmmaInteractions avec KellieInteractions avec NicoleInteractions avec Arthur
John-1010124410
Mike-5556575
Zach-64144
Emma-2888
Kellie-55
Nicole-4
Arthur-
Membre du Réseau socialInteractions avec JohnInteractions avec MikeInteractions avec ZachInteractions avec EmmaInteractions avec KellieInteractions avec NicoleInteractions avec Arthur
John-1012100108
Mike-502005
Zach-9013
Emma-221
Kellie-49
Nicole-1
Arthur-

Voici un exemple qui décrit comment appliquer l'algorithme d'oiseau flocage pour analyser les données de réseaux sociaux. Comme représenté, chaque élément est représenté par un oiseau dans l'espace virtuel. Notez que

  • Les oiseaux sont initialement dispersées de façon aléatoire dans l'espace virtuel.

  • Chaque oiseau a une vitesse et une position qui lui est associé.

  • Vitesse et de position sont calculés pour chaque oiseau, en utilisant trois vecteurs: la séparation, l'attraction et d'alignement.

  • Chaque oiseau se déplace selon les trois vecteurs, et ce mouvement produit le comportement de flocage vu dans la nature.

    image0.jpg

Voici les données d'interaction est analysée chaque semaine pour trouver les utilisateurs de réseaux sociaux similaires. Chaque semaine, les oiseaux peuvent être visualisées dans une grille simple. Les positions de ces oiseaux reflètent les interactions des individus réels dans le monde réel.

image1.jpg

» » » » Comment utiliser oiseaux grappes de troupeau dans l'analyse prédictive