En tenant compte des schémas de répétition distinctifs, il suffit de 50 tweets pour la détection –


  • FrançaisFrançais


  • Deux algorithmes qui rendent compte de l’utilisation distinctive de mots répétés et de paires de mots ne nécessitent que 50 tweets pour distinguer avec précision les messages trompeurs «trolls» de ceux publiés par des personnalités publiques. Sergei Monakhov de l’Université Friedrich Schiller à Jena, en Allemagne, présente ces résultats dans la revue en libre accès PLOS ONE le 12 août 2020.

    Les messages Internet Troll visent à atteindre un objectif spécifique, tout en masquant cet objectif. Par exemple, en 2018, 13 ressortissants russes ont été accusés d’avoir utilisé de faux personnages pour interférer avec l’élection présidentielle américaine de 2016 via des publications sur les réseaux sociaux. Alors que des recherches antérieures ont examiné les caractéristiques distinctives des tweets de troll – telles que le timing, les hashtags et l’emplacement géographique – peu d’études ont examiné les caractéristiques linguistiques des tweets eux-mêmes.

    Monakhov a adopté une approche sociolinguistique, se concentrant sur l’idée que les trolls ont un nombre limité de messages à transmettre, mais doivent le faire plusieurs fois et avec suffisamment de diversité de mots et de sujets pour tromper les lecteurs. En utilisant une bibliothèque de tweets de trolls russes et de vrais tweets de membres du Congrès américain, Monakhov a montré que ces restrictions spécifiques aux trolls entraînaient des modèles distinctifs de mots répétés et de paires de mots qui sont différents des modèles observés dans les tweets authentiques et non trolls.

    Ensuite, Monakhov a testé un algorithme qui utilise ces modèles distinctifs pour faire la distinction entre les vrais tweets et les tweets trolls. Il a constaté que l’algorithme ne nécessitait que 50 tweets pour une identification précise des trolls par rapport aux membres du Congrès. Il a également constaté que l’algorithme distinguait correctement les tweets de trolls des tweets de Donald Trump – qui, bien que provocants et «potentiellement trompeurs», selon Twitter, ne sont pas conçus pour cacher son objectif.

    Cette nouvelle stratégie d’identification rapide des tweets de trolls pourrait contribuer à éclairer les efforts de lutte contre la guerre hybride tout en préservant la liberté d’expression. Des recherches supplémentaires seront nécessaires pour déterminer s’il peut distinguer avec précision les tweets de troll des autres types de messages qui ne sont pas publiés par des personnalités publiques.

    Monakhov ajoute: «Bien que l’écriture des trolls soit généralement considérée comme imprégnée de messages récurrents, son trait le plus caractéristique est une distribution anormale de mots et de paires de mots répétés. En utilisant le rapport de leurs proportions comme mesure quantitative, il suffit de 50 tweets pour identifier les comptes de trolls sur Internet. “

    Source de l’histoire:

    Matériel fourni par PLOS. Remarque: le contenu peut être modifié pour le style et la longueur.

    Source

    La Rédaction

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

    Copy code