Notions de base en fonction du contenu de filtres d'analyse prédictive

Basé sur le contenu

Sommaire

systèmes d'analyse prédictive de recommandation correspondent la plupart du temps Caractéristiques (mots-clés) entre dans la catégorie des articles similaires et le profil de l'utilisateur de faire des recommandations. Lorsqu'un utilisateur achète un article qui a marqué les caractéristiques, les éléments avec des caractéristiques qui correspondent à ceux de l'élément d'origine seront recommandés. Les plus caractéristiques correspondent, plus la probabilité que l'utilisateur sera comme la recommandation. Ce degré de probabilité est appelé précision.

Notions de base de balises pour décrire des éléments

En général, l'entreprise faisant la vente (ou le fabricant) Tags habituellement ses articles avec des mots clés. Dans le site d'Amazon, cependant, il est assez typique de ne jamais voir les étiquettes pour les articles achetés ou vus - et même pas d'être invité à marquer un point. Les clients peuvent consulter les articles qu'ils ont achetés, mais ce ne est pas le même que le marquage.

Articles de marquage peuvent poser un défi à l'échelle pour un magasin comme Amazon qui a tant d'articles. En outre, certains attributs peuvent être subjectifs et peuvent être incorrectement étiqueté, selon qui il balises. Une solution qui résout le problème de mise à l'échelle est de permettre aux clients ou le grand public à la tag les articles.

Pour garder balises gérable et précise, un ensemble acceptable de balises peut être fourni par le site. Seulement quand un nombre approprié d'utilisateurs d'accord (qui est, utiliser la même étiquette pour décrire un élément), seront convenues lors de tag être utilisé pour décrire l'article.

Marquage basé sur l'utilisateur, cependant, se présente d'autres problèmes pour un système de filtrage basé sur le contenu (et filtrage collaboratif):

  • Crédibilité: Tous les clients ne disent pas la vérité (surtout en ligne), et les utilisateurs qui ont seulement une petite histoire de notation peuvent fausser les données. En outre, certains fournisseurs peuvent donner (ou encourager les autres à donner) Les notes positives à leurs propres produits tout en donnant des notes négatives aux produits de leurs concurrents.




  • Parcimonie: Non tous les articles seront nominale ou auront suffisamment de notes pour produire des données utiles.

  • Incohérence: Pas tous les utilisateurs utilisent les mêmes mots-clés pour marquer un point, même si le sens peut être le même. En outre, certains attributs peuvent être subjective. Par exemple, un spectateur d'un film peut considérer qu'il est à court tandis que l'autre dit qu'il est trop long.

Attributs besoin de définitions claires. Un attribut avec trop peu de limites est difficile de evaluate- imposer trop de règles sur un attribut peut être de demander aux utilisateurs de faire trop de travail, qui va les décourager de marquage articles.

Tagging la plupart des articles dans un catalogue de produits peut aider à résoudre le problème de démarrage à froid qui sévit filtrage collaboratif. Pendant un certain temps, cependant, la précision des recommandations du système sera faible jusqu'à ce qu'il crée ou obtient un profil d'utilisateur.

Voici une matrice de clients et de leurs articles achetés échantillon, montre un exemple de filtrage basé sur le contenu.

ArticlesCaractéristique 1Caractéristique 2Caractéristique 3Caractéristique 4Caractéristique 5
Point 1XX
Point 2XX
Point 3XXX
Point 4XXX
Point 5XXX

Ici, si un utilisateur aime Feature 2 - et qui est enregistré dans son profil - le système recommandera tous les éléments qui ont la particularité 2 en eux: Point 1, Point 2 et 4 de l'article.

Cette approche fonctionne même si l'utilisateur n'a jamais acheté ou revu un article. Le système sera simplement regarder dans la base de données de produits pour tout article qui a été marqué avec Feature 2. Si (par exemple) un utilisateur qui cherche les films avec Audrey Hepburn - et que la préférence apparaît dans le profil de l'utilisateur - le système recommandera tout les films qui comportent Audrey Hepburn à cet utilisateur.

Cet exemple, cependant, expose rapidement une limitation de la technique de filtrage basé sur le contenu: l'utilisateur sait probablement déjà environ tous les films que Audrey Hepburn a été, ou peut facilement trouver - si, du point de vue de l'utilisateur, le système n'a rien recommandé de nouveau ou de la valeur.

Comment améliorer la précision avec rétroaction constante

Une façon d'améliorer la précision des recommandations du système est de demander aux clients de rétroaction chaque fois que possible. Recueillir les commentaires des clients peut être fait de plusieurs façons différentes, à travers de multiples canaux. Certaines entreprises demandent aux clients d'évaluer un article ou service après l'achat. Autres systèmes fournissent des liens-media style sociale afin que les clients peuvent “ comme ” ou “ aversion ” un produit. Interaction constante entre

Comment mesurer l'efficacité des recommandations de système

Le succès des recommandations d'un système dépend de la façon dont il répond à deux critères: précision (penser comme un ensemble de correspondances parfaites - habituellement un petit ensemble) et rappel (penser comme un ensemble de correspondances possibles - le plus souvent un ensemble plus large). Voici un aperçu de plus près:

  • Précision mesure le degré de précision de la recommandation du système était. La précision est difficile à mesurer car il peut être subjective et difficile à quantifier. Par exemple, quand un utilisateur visite d'abord le site Amazon, Amazon peut savoir avec certitude si ses recommandations sont sur la cible?

    Certaines recommandations peuvent se connecter avec les intérêts du client, mais le client peut toujours pas acheter. La confiance la plus élevée qu'une recommandation est précis vient de preuve claire: Le client achète le produit. Alternativement, le système peut demander explicitement à l'utilisateur d'évaluer ses recommandations.

  • Rappel mesure l'ensemble de possibles bonnes recommandations de votre système est livré avec. Pensez rappel comme un inventaire de recommandations possibles, mais pas tous d'entre eux sont des recommandations parfaites. Il est généralement une relation inverse entre la précision et le rappel. Autrement dit, comme le rappel monte, descend de précision, et vice versa.

Le système idéal aurait à la fois une haute précision et de haute rappel. Mais, en réalité, le meilleur résultat est de trouver un équilibre délicat entre les deux. Soulignant la précision ou rappeler dépend vraiment sur le problème que vous essayez de résoudre.


» » » » Notions de base en fonction du contenu de filtres d'analyse prédictive