Projet IC05

Visualisation : Analyse des tweets dédiés aux néonécotinoïdes


La deuxième partie de notre analyse se base sur le réseau social twitter. Pour cela nous avons utilisé la librairie twint sous python afin de récupérer les données qui nous intéressent sur la plateforme sous forme de fichier csv. Puis dans un second temps nous avons utilisé R (avec différentes librairies de visualisation et d'analyse de données) afin de traiter et d'exploiter ces données. Les données récupérées se divisent en quatre grandes familles.

Les tweets en France sur le sujet

Historiquement

Dans un premier temps, nous avons récupéré l'ensemble des tweets qui ont été publié en France et qui contiennent le mot clé "Néonicotinoides". Cette extraction nous a permis de récupérer 766 tweets avec pour chacun la date de publication, l'utilisateur, le contenu du tweet, le nombre de réponse, de retweet et de like.

La première observation qui peut être faite est que le nombre de tweet sur le sujet est faible : moins de 800 tweets en une dizaine d'années. De plus, l'analyse des dates de publication des tweets permet de montrer que près de 95% de ces tweets ont été publié après le 1 janvier 2020 (716 des 766 tweets). Ce qui montre que le sujet n'est apparu sur la plateforme que tardivement et qu'il reste globalement peu présent. Les deux frises ci-dessous permettent ainsi de montrer l'évolution du nombre de tweet en fonction du temps.

Representation des données
Representation des données

Sur la première on observe cette évolution depuis 2013 (date du premier tweet sur le sujet en France) tandis que la deuxième est recentrée sur la période d'explosion du nombre de tweet.
Deux pics se dessinent clairement sur la deuxième frise. Un premier en octobre 2020 et un second après mai 2021. Ces deux pics correspondent :

  • pour octobre 2020 à la réintroduction temporaire des néonicotinoïdes ;
  • pour mai 2021 à l'interdiction définitive de 3 néonicotinoides.

Il existe donc une corrélation évidente qui se traduit par une augmentation du nombre de tweets entre les arbitrages pris au niveau politique et les réactions dans le débat publique.

On peut également noter qu'il y a de légères augmentations du nombre de tweet en amont de ces deux pics qui correspondent aux périodes de débat qui précèdent l'arbitrage. Cette augmentation est d'autant plus visible pour le pic d'octobre 2020.

Enfin, nous pouvons remarquer que le premier tweet au sujet des néonicotinoides en France a été publié le 30 avril 2013 alors que le sujet a explosé bien plus tôt chez les agriculteurs et politiques. Pourtant, le premier tweet le mot "neonicotinoids" remonte au 19 novembre 2008 et a été publié en Angleterre : "Ban with immedate effect the group of substances known as neonicotinoids". Il invite à signer une pétition pour l'interdiction des néonicotinoides. Ce délai peut s'expliquer par le fait que Twitter a été créé en 2006 mais la démocratisation de son utilisation remonte seulement à 2011 avec 100 millions d'utilisateurs inscrits. Cela met tout de même en évidence qu'il existe bien un délai non négligeable entre

  • la mise en évidence du problème sur le terrain ;
  • la sensibilisation au niveau international (entre 2008 et 2013) ;
  • et la sensibilisation des citoyens français (depuis 2013).

Le contenu des tweets

Dans un second temps, nous nous sommes penchés sur l'analyse textuelle de ces tweets. L'objectif ici est de comprendre comment s'articulent les avis à ce sujet en faisant ressortir les mots les plus utilisés dans les tweets. C'est ce que permet le nuage de mot ci-dessous (ici la couleur permet de simplifier la lecture mais n'a pas de sens précis).

nuage_de_mot8.png

Ce nuage de mots est généré avec un min_count = 10, ce sont donc les mots qui apparaissent plus de 10 fois dans l'ensemble des tweets qui sont affichés.

On observe tout d'abord que le mot qui ressort le plus est "Neonicotinoides" ce qui semble logique du fait que la recherche ait été effectuée sur ce mot.

Viennent ensuite les mots qui sont directement liés à la polémique autour des néonicotinoides : "Abeilles", "Betterave", "Pesticide", "réintroduction"... et des mots qui sont liés aux acteurs, aux arènes et au décision des arbitrages : "Vote", "gouvernement","l'assemblée", "députés", "loi", "politique", "ministre", "interdit", "autorise", "dérogation"...
Ces mots semblent avoir un rôle bien précis : ils ont pour objectif d'apporter des informations factuelles sur les arbitrages qui sont fait afin de tenir informer le lecteur.

D'une autre part, on retrouve des mots à connotation négative qui expriment l'opposition d'une majorité des utilisateurs avec les arbitrages pris : "Tueurs", "Cancer", "pollution", "#poisons", "perturbateurs"... ainsi que plusieurs smileys représentant des dangers : tête de mort, X, panneau attention, haut parleur...
La présence de ces mots nous permet de conclure que la majorité des utilisateurs Twitter s'opposent aux néonicotinoides.

Enfin twitter est également une plateforme d'interpellation. Cet aspect de la plateforme se traduit par le fait que certains comptes sont souvent cités, on retrouve :

  • des comptes de personnalités politiques comme : @barbarapompili, ministre de la transition écologique et @emmanuelmacron ;
  • le compte du gouvernement @gouvernementfr et les comptes de partis politiques comme Europe Ecologie Les Verts @eelv et La Republique En Marche @larem_an. En parallèle avec l'étude des votes de l'Assemblée nationale dans la partie suivante, on remarque que ce sont les députés de ces partis qui ont des avis très tranchés et qui ont penché dans la balance décisionnelle : 135 votes pour la réintroduction chez LREM contre seulement 32 contre, et au contraire entièrement des votes contre chez les parties écologistes ;
  • des comptes d'information comme @franceinfo et @ouestfrance ;
  • des comptes militants pour l'interdiction des pesticides comme @coquelicots_ et génération écologie @gecologie.

Afin de compléter cette première analyse textuelle, nous en avons réalisé une seconde sur le même corpus de tweets. Dans cette seconde analyse, nous avons étudiés la fréquence des associations de deux mots qui sont le plus souvent utilisés ensemble. On obtient donc le nuage de mot ci-dessous (ici aussi, la couleur a pour seul objectif de simplifier la lecture).

mot_lie.png

Ce nuage d'associations de mots est généré avec un min_count = 5, ce sont donc les associations de 2 mots qui apparaissent plus de 5 fois dans l'ensemble des tweets qui sont affichés.

Ici les associations de mots permettent de mieux comprendre l'utilisation des différents mots vus précédemment.

On retrouve notamment plusieurs associations de mots à connotation négative qui peuvent compléter ceux trouver précédemment, à savoir : "tueurs d'abeilles", "retour #poisons", "#poisons tueurs", "seine poubelle", "tueurs #cancérigènes"...

On remarque également que parmi ces associations de mots, on en retrouve plusieurs qui sont caractéristiques de la loi d'octobre 2020 : "voté retour", "retour #neonicotinoides", "projet loi", "celles voté", "valide retour", "liste votant"... ce qui permet d'appuyer les observations faites précédemment selon lesquelles c'est cette loi qui marque le plus les débats dans l'espace public.

Enfin, les associations de plusieurs mots montrent un appel à la mobilisation des utilisateurs : "pétition retour", "porter plainte", "plainte pollution", "sauver abeilles", "#cadoitsesavoir #neonicotinoides", "sauvons abeilles"...

La comparaison de ces analyses textuelles avec celle réalisée sur les commentaires des vidéos youtube nous permet de souligner les différences entre ces deux espaces. Effectivement, tandis que sur Youtube les commentaires se concentrent sur la forme, et notamment sur la personne qui parle plutôt que sur ces propos, Twitter est un espace d'information, d'interpellation et de mobilisation dans lequel les interactions sont centrées sur la controverse.

Avec plus du temps, il aurait été intéressant de réaliser une analyse des sentiments en utilisant TidyText (notamment sur les nuages de mots obtenus) afin d'obtenir une coloration en rapport avec les sentiments exprimés par les utilisateurs.

Quelques statistiques sur ces tweets

Dans un troisième temps, nous avons réalisé des statistiques sur ces tweets et nous les avons résumés dans le tableau ci-dessous. Ces dernières ne sont pas déterminantes mais permettent d'apporter un complément d'information sur le débat. En effet, elles montrent que la majorité des tweets sur ce sujet ne mène pas à des échanges mais à des simples likes et retweets. Cela montre tout de même qu'une partie des utilisateurs soutiennent et suivent le débat, mais sans se prononcer réellement.

tableau_tweet.png

On pourrait penser que le peu de réaction s'explique par le fait que les utilisateurs qui tweetent à ce sujet sont très peu suivi sur la plateforme. Nous allons donc nous intéresser plus précisément à ces utilisateurs pour pouvoir affirmer ou infirmer cette hypothèse.

Etudes des utilisateurs qui tweetent au sujet des néonicotinoides

On peut analyser les utilisateurs qui tweetent au sujet des néonicotinoides sous deux angles.

Tout d'abord nous nous sommes intérressés au nombre de tweet sur le sujet publié par utilisateur et aux utilisateurs qui tweetent le plus à ce sujet.

On observe que plus de la moitié des utilisateurs qui tweetent sur le sujet ne publient qu'un unique tweet à ce propos. Cependant, certains utilisateurs, moins nombreux, en publient beaucoup plus : jusqu'à 26 tweets (tous entre aout et octobre 2020) sur le sujet pour le militant @claude_riche.

On retrouve également de nombreux tweets par des membres de groupes écologiques comme par exemple :

  • Samuel Leré (18 tweets sur le sujet) de la Fondation Nicolas Hulot ;
  • Chloé Sagaspe (16 tweets sur le sujet) du partie Europe Ecologie les Verts ;
  • Guillaume Gontard (13 tweets sur le sujet), président du groupe Ecologiste Senat ;
  • Helene Richet (12 tweets) et Sophie Haristouy (10 tweets sur le sujet) de Génération Ecologie.

Il est intéressant de noter que les 10 utilisateurs qui tweetent le plus à ce sujet sont tous opposés aux néonicotinoides. Deux hypothèses peuvent expliquer cela :

  • être pour l'utilisation de néonicotinoïdes est tabou dans l'espace public, et peut-être d'autant plus sur une plateforme sur laquelle les débats peuvent s'enflammer rapidement ;
  • et/ou la population de Twitter est majoritairement contre les néonicotinoides.

On peut également évoquer d'autres utilisateurs qui ont fait moins de tweets sur le sujet mais qui ont eu une portée plus importante :

Prenons les comptes d'informations et notamment la page twitter du journal Le Monde qui a près de neuf millions de followers. Avec son tweet "« La Seine n’est pas une poubelle »: le président de la métropole de Rouen décidé à porter plainte après une pollution aux #néonicotinoïdes", elle a suscité plus d'une centaine de réactions. Celle-ci semble importante quand on la compare aux autres tweets sur le sujet mais faible quand on la compare au nombre de followers du compte.

Concernant les comptes de personnages politiques, nous pouvons analyser celui de Xavier Bertrand qui, avec près de 185 000 followers, est plutôt représentatif. Son unique tweet à ce sujet est en faveur des néonicotionoides : "L’Etat demande aux betteraviers de mener des études pour trouver une alternative aux #néonicotinoïdes en 3 ans alors qu’elles devaient s’étaler sur 5 ans ! Si nos #agriculteurs ne sont pas prêts, l’Etat devra compenser leurs pertes si nous ne voulons pas les voir disparaître !". Il engendre une centaine de réactions (8 réponses, 41 retweets et 68 likes), ce qui est très important comparé à la moyenne sur les tweets à ce sujet. Ces chiffres montrent que certains utilisateurs soutiennent la réintroduction mais n'osent pas s'exprimer sur le sujet sur cette plateforme. En parallèle, ils montrent aussi que le tweet est controversé puisqu'il fait plus de bruit. Ce tweet est aussi révélateur quant à la géographie de la controverse. En effet, Xavier Bertrand est président de communautés d'agglomérations des Hauts-de-France, terres de culture des betteraves, en opposition aux régions du midi et du sud où les apiculteurs sont prédominants. A travers ce tweet, il défend donc ses territoires et ses agriculteurs, et donc son économie.

Pour compléter ces observations, nous avons étudié ces utilisateurs sous un deuxième angle avec une étude plus générale. Pour cela nous avons réalisé un nuage de mots présents dans leur biographie Twitter. On obtient ainsi le résultat ci-dessous (couleur non significative) :

Bio_utilisateur.png

Ainsi ce nuage de mots nous permet d'analyser qui sont les utilisateurs qui tweetent le plus au sujet des néonicotinoides. On retrouve plusieurs types de personnes :

  • principalement des personnalités politiques : "secrétaire", "conseiller", "maire", "député", "président", "élu", "délégué", "adjointe", "@larem_an"...
  • mais également des personnes sensible à cette controverse : "militant", "écologiste", "ingénieur", "auteur", "journaliste"...

Enfin on retrouve les sujets et les valeurs par lesquels les utilisateurs se définissent : "engagé", "passionné", "durable", "transition", "santé", "#agriculture"...

Finalement, on observe qu'une partie des personnes qui tweetent à ce sujet sont des personnes influentes et qui jouent un rôle dans les arbitrages. Le peu de réaction que suscitent leurs tweets à propos des néonicotinoïdes n'est donc pas dû à leur faible influence générale. Il semblerait donc que c'est plutôt le sujet qui ne suscite qu'un intérêt limité sur les réseaux sociaux.

Pour approfondir cet aspect de l'étude il serait intéressant de comparer le nombre de réactions sur les tweets au sujet des néonicotinoides postés par ces personnes influentes avec le nombre de réaction moyen que leurs tweets engendrent. Nous pourrions ainsi essayer de valider notre hypothèse selon laquelle la controverse des néonicotinoïdes reste un sujet qui n'engendre que peu de débat et de réaction dans l'espace public.

Etude géographique des tweets

Pour conclure notre étude twitter, nous nous sommes questionnés sur la répartition de l'utilisation de twitter en France au sujet des néonicotinoides.

Nous avons donc récupéré le nombre de tweets publiés à ce sujet dans différentes zones afin de voir si l'on pouvait observer une concentration de tweets plus importantes dans les zones directement concernées par ces pesticides.

Les différentes observations sont résumées dans le tableau ci-dessous. Les résultats sont arrondis à la dizaine près.

Geo_tweet.png
carte.png

Sur la carte, la taille des cercles correspond au rayon dans lequel a été réalisée l'aspiration et le chiffre au nombre de tweets récupérés. En prenant en compte les zones étudiées et le nombre de tweets dans chacune, ces observations ne nous permettent pas de conclure que le nombre de tweets à ce sujet est plus important dans certaines zones que dans d'autres, excepté pour Paris qui regroupe près d'un quart des tweets sur le sujet. Il faut cependant nuancer cette sur-représentation du fait que Paris regroupe probablement un nombre d'utilisateurs de twitter plus important que les autres zones. Autrement, la répartition semble homogène dans toute la France.

Il semblerait donc que les populations rurales ne s'expriment pas plus à ce sujet que les populations citadines.

Dans la continuité de cette étude géographique, deux pistes pourraient être creusées.

  • La première serait d'observer la provenance des personnes qui soutiennent les tweets à ce sujet que ce soit par des retweets ou des likes. On aurait ainsi une population plus importante à étudier, ce qui nous permettrait peut-être d'obtenir une répartition géographique plus intéressante.
  • La première serait d'observer la provenance des personnes qui soutiennent les tweets à ce sujet que ce soit par des retweets ou des likes. On aurait ainsi une population plus importante à étudier, ce qui nous permettrait peut-être d'obtenir une répartition géographique plus intéressante.