Effectuer l'analyse des sentiments sur twitter

category Ordinateurs et logiciels / Programmation / Python

Il semble que tout le monde utilise Twitter pour faire connaître aujourd'hui ses sentiments. Bien sûr, le problème est que personne ne sait vraiment les points communs de ces sentiments - qui est, si quelqu'un pouvait tirer toute sorte de tendance à partir de tous ces tweets là-bas.

L'exemple suivant montre comment classer les tweets que des sentiments positifs ou négatifs automatiquement. L'exemple utilise sentiments spécifiques que vous pouvez modifier à voir des résultats différents.

de NaiveBayesClassifierfrom d'importation nltk.classify LogisticRegressionpositive_tweets TfidfVectorizerfrom sklearn.feature_extraction.text d'importation sklearn.linear_model d'importation = [('fleurs sentent bon »,« positive »), (« Les oiseaux sont beaux »,« positive »), (« Cela va être un grand jour »,« positive »), (« I love My BFF »,« positive »), (« Ce restaurant a beaucoup de nourriture »,« positive »)] negative_tweets = [('Oignons sentent mauvais», «négative '), (' ordures est laid »,« négatif »), (« Rien est allé droit aujourd'hui »,« négatif »), (« Je déteste mon patron »,« négatif »), (« Ce restaurant a une nourriture infecte " , «négatif»)] test_tweets = [(«Chanter me rend heureux», «positive»), («Le ciel bleu sont gentils», «positive»), («I love printemps», «positive»), («toux me rend triste »,« négatif »), (« Ciel nuageux sont déprimants »,« négatif »), (« Je déteste l'hiver »,« négatif »)] X_train, y_train = zip (* positive_tweets + negative_tweets) X_test, y_test = zip (* test_tweets) tfidfvec = TfidfVectorizer (minuscules = True) = vectorisée tfidfvec.fit_transform (X_train) sentiment_classifier = LogisticRegression () sentiment_classifier.fit (vectorisée, y_train) vectorized_test = tfidfvec.transform (X_test) prédiction = liste (sentiment_classifier.predict ( vectorized_test)) = probabilités liste (sentiment_classifier.predict_probavectorized_test) [:, 1]) 'impression des étiquettes correctes:% s% s% s% s% s% s'% y_testprint 'prédiction:% s% s% s% s% s % s '% tuple (prédiction) print' proba positif:% 0.6f% 0.6f% 0.6f% 0.6f% 0.6f% 0.6f '% tuple (probabilités)

L'exemple commence par créer des données d'entraînement qui se compose de tweets positifs et négatifs. Plus tard dans l'exemple, le code crée X_train et y_train de ces tweets. Afin de tester l'algorithme résultant, vous devez également les données d'essais, qui se présente sous la forme de test_tweets. L'exemple crée tard X_test et y_test de ces tweets. Ces éléments constituent les données utilisées pour simuler tweets pour l'exemple.

Avant que le code peut faire quelque chose avec les tweets, les tweets doivent être vectorisés puis classés. Le problème de la classification brise vers le bas dans les mots les plus petits morceaux que l'algorithme peut utiliser pour identifier les points communs entre les données d'apprentissage et les données d'essai.

À ce stade, l'algorithme formé est testé pour assurer que la formation a travaillé comme prévu. La sortie suivante montre les résultats du processus de formation et les tests:

étiquettes correctes: negativeprediction negativenegative positif positif positif: positif négatif negativeproba de negativepositive positif positif: 0.497926 0.555813 0.561923 0.4979260.555813 0,434459

A propos Auteur

Classes en C ++

C ++ utilise une structure connue sous le nom classe. Une définition de classe commence avec le mot-clé classe suivi du nom de la classe et une accolade ouverte. Une classe a le format suivant:classe Person {public: char szFirstName [128] -char…

Contexte de HTML5 canvas attributs

Chaque contexte HTML5 Canvas contient des attributs qui peuvent être modifiés par le code javascript. Notez que les attributs sont affectés à la toile contextes, pas des objets de toile individuels. Attributs d'un contexte sont…

Comment créer un facteur de r

Pour créer un facteur R, vous utilisez le factor () fonction. Les trois premiers arguments de factor () justifier une exploration:X: Le vecteur d'entrée que vous souhaitez transformer en un facteur.niveaux: Un vecteur facultatif des valeurs qui X…

Siri conseils de ponctuation pour e-mail, les messages texte et les notes

Ne pas oublier de donner des ordres verbaux de ponctuation lorsque dicter à Siri. Voici une liste exhaustive de ce que vous pouvez dire. Ils sont de grands épargnants de temps lorsque vous êtes sur la route!Siri texte Commandes PonctuationLorsque…

Décrire les choses de nouveau dans l'histoire que vous écrivez

Lorsque vous décrivez un objet dans l'écriture créative, une personne ou un lieu, trouver les mots justes peut être difficile si vous voulez éviter de retomber sur cliché # 233-. Les lecteurs sont devenus tellement habitués à certains mots…

Comment vaincre les démons d'orthographe

Vous pouvez orthographier un mot, à tout moment. Tout ce qu'il faut est un glissement de doigt, et «pluie» devient «rayn '. Quelques mots, cependant, attirent erreurs la façon dont un chandail noir attire la charpie. Mémorisez…

Comment sons arabes prononcer

Pour être compris en arabe, vous avez besoin de reconnaître et de savoir comment prononcer certains sons distincts qui diffèrent de l'anglais, ou qui ne existe pas dans tout l'anglais. Le système sonore arabe est pas aussi différente de…

Comment dessiner des graphiques linéaires sur un ordinateur

La meilleure façon de dessiner une ligne graphique en utilisant un ordinateur est d'utiliser un tableur programme tel que Microsoft Excel ou OpenOffice Calc, qui est gratuit.Saisie de vos données graphiques en lignePour entrer les données pour…

Comment dessiner des diagrammes circulaires sur un ordinateur

Dessiner un diagramme circulaire sur l'ordinateur est une expérience fantastique, au moins par rapport à faire à la main. Il faut quelques secondes, et vous ne devez pas se rappeler comment utiliser un rapporteur ou d'inquiétude à propos de…

Comment étiqueter clairement les axes sur un histogramme statistique

La partie la plus complexe de l'interprétation d'un histogramme statistique est d'obtenir une poignée sur ce que vous voulez montrer sur la X et y axes. Avoir de bonnes étiquettes descriptives sur les axes aidera. La plupart des logiciels…

Un truc rapide pour les introvertis de réduire soliloque négatif

La plupart des introvertis sont des âmes très aimables. . . sauf quand elle vient à être gentil avec eux-mêmes. Alors que tous les gens se le coup mentalement maintenant et puis, les introvertis sont particulièrement sujettes à…

Améliorer votre liberté émotionnelle résultats de la technique

Lors de la pratique de la thérapie énergétique appelé Emotional Freedom Technique, vous pouvez faire plusieurs choses pour améliorer les résultats que vous obtenez. Tout d'abord, assurez-vous que vous êtes précis avec vos mots:Essayez…

Dix roses populaires

Vous recherchez populaire variétés de roses? Pour les dernières années, ces dix roses ont été populaire parmi les jardiniers amateurs:'Ballerina': rose et blanc arbuste'Blaze': Rouge grimpeur'Bonica »: rose arbuste«Chrysler…

Les symptômes qui disent «la ménopause est à venir»

Pour la majorité des femmes, symptômes de la ménopause (que vous ressentez parce que vos hormones sont de plus déséquilibrée) commencent à apparaître avant les périodes viennent à un arrêt. Consultez cette liste, et si vous trouvez que…

godiches.com » Ordinateurs et logiciels » Programmation » Python » Effectuer l'analyse des sentiments sur twitter