Notions de base de filtres collaboratifs basés sur les utilisateurs dans l'analyse prédictive

Avec une approche basée sur l'utilisateur de filtrage collaboratif dans l'analyse prédictive, le système peut calculer la similarité entre les paires d'utilisateurs en utilisant la formule de similarité cosinus, une technique un peu comme l'approche basée sur l'article. Habituellement, ces calculs prennent plus de temps à faire, et peut-être besoin d'être calculé plus souvent que ceux utilisés dans l'approche basée sur l'article. C'est parce que

  • Vous auriez beaucoup plus d'utilisateurs que les éléments (idéalement de toute façon).

  • Vous vous attendez éléments à modifier moins fréquemment que les utilisateurs.

  • Avec plus d'utilisateurs et moins de changement dans les articles proposés, vous pouvez utiliser de nombreux attributs plus que juste l'historique d'achat lors du calcul de l'utilisateur similitude.

Un système basé sur l'utilisateur peut également utiliser des algorithmes d'apprentissage automatique pour regrouper tous les utilisateurs qui ont montré qu'ils ont les mêmes goûts. Le système crée des quartiers les utilisateurs qui ont des profils similaires, les habitudes d'achat, ou notation motifs. Si une personne dans un quartier achète et aime un élément, le système de recommandation peut recommander que le point à tout le monde dans le quartier.

Comme basée sur l'article filtrage collaboratif, l'approche basée sur l'utilisateur nécessite suffisamment de données sur chaque utilisateur pour être efficace. Avant que le système peut faire des recommandations, il doit créer un profil d'utilisateur - il exige également que l'utilisateur de créer un compte et être connecté (ou les informations de session de magasin dans le navigateur via des cookies) pendant la visualisation d'un site Web.

Initialement, le système peut demander à l'utilisateur de manière explicite pour créer un profil, étoffer le profil en posant des questions, et ensuite optimiser ses suggestions après les données d'achat de l'utilisateur a accumulé.

Netflix est un exemple de construire rapidement un profil pour chaque client. Voici la procédure générale:

  1. Netflix invite ses clients à mettre en place des files d'attente des films qu'ils aimeraient regarder.

  2. Les films choisis sont analysés pour en apprendre davantage sur les goûts du client dans les films.

  3. Le modèle prédictif recommande plus de films pour le client à regarder, sur la base des films déjà dans la file d'attente.




Une matrice de l'échantillon de clients et de leurs articles achetés - est un exemple de filtrage collaboratif basée sur l'utilisateur. Pour plus de simplicité, utiliser une règle selon laquelle un quartier d'utilisateur est créé par les utilisateurs qui ont acheté au moins deux choses en commun.

ClientPoint 1Point 2Point 3Point 4Point 5Point 6
A - N1XXX
B - N1XX
C - N2XX
D - N2XXX
E - N1XX
F - N1XXXX
G - N1XX
H - N3X
I - N3X

Il ya trois quartiers d'utilisateurs formés: N1, N2, N3 et. Chaque utilisateur dans les quartiers N1 et N2 a acheté au moins 2 éléments en commun avec quelqu'un d'autre dans le même quartier. N3 sont les utilisateurs qui ne respectent pas encore les critères et ne recevra pas les recommandations jusqu'à ce qu'ils achètent d'autres éléments pour satisfaire aux critères.

Voici un exemple de la façon dont vous pourriez utiliser ce système de recommandation:

Hors ligne grâce à une campagne de marketing par e-mail ou si l'utilisateur est sur le site tout en étant connecté Le système pourrait transmettre des annonces de marketing ou de faire des recommandations sur le site Internet de la manière suivante.:

  • Point 3 au Client B

  • Point 4 au Client C

  • Article 1 à la clientèle E

  • Point 3 au Client F

  • Point 2 au Client G

  • Élément indéterminé de clients A et D

    Idéalement, vous devriez avoir beaucoup plus d'éléments que six. Et il devrait toujours y avoir certains éléments dans le quartier d'un client que le client n'a pas encore achetés.

  • Article indéterminée aux clients H et I

    Dans ce cas, les données sont insuffisantes pour servir de base d'une recommandation.

Une différence très importante est que, puisque chaque client appartient à un groupe, tous les achats futurs qu'un membre fait seront recommandés aux autres membres du groupe jusqu'à ce que le filtre est recyclé. Donc, le client A et D vont commencer recommandations très rapidement car ils appartiennent déjà à un quartier et sûrement les autres voisins vont acheter quelque chose bientôt.

Par exemple: si le client achète B Article 6, le système de recommandation recommandera l'article 6 de tout le monde dans N1 (client A, B, E, F et G).

F client peut éventuellement appartenir à la région N1 ou N2 selon la façon dont l'algorithme de filtrage collaboratif est mis en oeuvre.

Clients H et I fournissent des exemples de la problème de démarrage à froid: Le client a tout simplement pas généré suffisamment de données pour être regroupés dans un quartier de l'utilisateur. En l'absence d'un profil d'utilisateur, un nouveau client avec très peu ou pas d'antécédents d'achat - ou qui ne achète éléments obscurs - sera toujours poser le problème de démarrage à froid du système, quel que soit l'approche collaborative filtrage est en cours d'utilisation.

Client I illustre un aspect du problème de démarrage à froid qui est unique à l'approche basée sur l'utilisateur. L'approche basée sur l'article serait commencer à trouver d'autres articles similaires à l'élément que le client bought- puis, si d'autres utilisateurs commencent achat article 6, le système peut commencer à faire des recommandations.

Pas de nouveaux achats ne doit être faite par l'utilisateur par la l'approche basée sur l'article peut commencer à recommander. Dans un système basé sur l'utilisateur, cependant, la clientèle que je doit faire des achats supplémentaires pour appartenir à un quartier d'utilisateurs- le système ne peut pas faire encore de recommandations.

D'accord, il ya une hypothèse à l'œuvre dans ces exemples simples - à savoir, que le client non seulement acheté l'article, mais aimait assez pour faire des achats semblables. Que faire si le client n'a pas aimé l'article? Le système doit, à tout le moins, de produire une meilleure précision dans ses recommandations.

Vous pouvez ajouter un critère pour le système de recommandation pour les personnes du groupe qui ont donné des cotes similaires pour les articles qu'ils ont achetés. Si le système trouve les clients qui aiment et détestent les mêmes éléments, l'hypothèse de la haute précision est valable. En d'autres termes, il ya une forte probabilité que les clients partagent les mêmes goûts.


» » » » Notions de base de filtres collaboratifs basés sur les utilisateurs dans l'analyse prédictive