Encyclopédie Wikimonde

Twittoscope

Aller à : navigation, rechercher

Twittoscope est un baromètre de l'opinion politique sur le réseau social Twitter dans la perspective de l'élection présidentielle de 2012 en France. Il a été lancé en février 2010 par le journal Métro, TF1 News, TNS Sofres et Semiocast. Les résultats sont publiés le deuxième mercredi de chaque mois sur le site de Semiocast[1], sur papier (journal Métro) et sur le site des autres partenaires. Le dernier Twittoscope a été publié le 10 avril 2012[2].

La méthodologie

Le recueil des messages

Il se fait à partir de mots-clés (sur la base d'une liste d'environ 140 personnalités politiques majeures en France) en tenant compte du nom, du prénom, des surnoms et des abréviations (par exemple « DSK », « Sarko » ou « MAM »)… Cette liste est évolutive et pourra être complétée selon l'actualité.

Le filtrage

Il sert à éliminer de manière automatique tous les messages citant des homonymes. Cette technique permet de garantir par exemple que les messages parlant de Royal évoquent bien la présidente du Conseil Regional de Poitou-Charentes et non l'adjectif ou une marque commerciale. De même, les messages parlant de Marine Le Pen sont distingués de ceux citant son père, etc...

Le Top 20

Il est calculé, pour chaque personnalité, en comptabilisant mois par mois tous les messages qui l'évoquent. Il permet d'établir le classement des 20 personnalités politiques les plus citées.

Le Mood

Il mesure les sentiments associés aux personnalités politiques dans les messages. Pour l'analyse, 4 catégories de « sentiments » ont été distinguées :

  • Les Positifs : c'est-à-dire les messages formulant une opinion positive que ce soit pour saluer une action, une attitude, un avis, soit par adhésion pure et simple à l'individu ou à ses idées ;
  • Les Échanges d'info : ce sont les messages évoquant une personnalité sans pour autant formuler une opinion positive, une critique ou un rejet. Cela peut être la reprise d'une intervention, d'un événement, d'un titre de presse ou de blog, sans commentaire personnel associé ;
  • Les Critiques : ils désignent les messages formulant une critique soit directement soit de façon ironique (cette catégorie propre au sujet politique a été spécialement identifiée pour le Twittoscope) ;
  • Les Rejets : ce sont les messages formulant un rejet clair et franc de la personnalité (voire une insulte).

Le codage des tweets selon ces 4 catégories est effectué manuellement avant d'être automatisé. Des tests sont réalisés régulièrement pour valider cette codification[3].

Gestion des spams

Twitter est une plateforme souvent prise d'assaut par les spammeurs[4]. La méthodologie du Twittoscope[5] inclut donc une phase d'élimination des spams consistant à détecter des activités suspectes, type bourrage de tweets, et d'éliminer les messages postés de manière automatique sur un nombre important de comptes comme ceux envoyés depuis le site de François Hollande lors du deuxième débat de la primaire socialiste en septembre 2011[6].

Références

Liens externes

Article publié sur Wikimonde Plus

Erreur Lua dans Module:Suivi_des_biographies à la ligne 197 : attempt to index field 'wikibase' (a nil value).