Détection du spam

Il existe plusieurs logiciels permettant une détection instantanée du spam mais la fiabilité est variable selon l’algorithme utilisé. Il n’existe pas un seul mode de fonctionnement pour tous les antispams .

José Marcio , responsable de la sécurité réseaux aux Mines de Paris insisté sur des critères communs de détection , par exemple pour Facebook , le rapport du nombre d’amis sur le nombre de message envoyé est assez significatif. 

 «il existe des logiciels permettant de cherche dans les commentaires les liens qui sont postés et qui vérifient où ils conduisent et qui comparent ces adresses à une base de données de liens qualifiés de spam ».

 

« Il y a des mots comme viagra qui reviennent quasiment tout le temps. Il y a aussi des systèmes qui regardent avec quelle fréquence ces émetteurs essaient de rentrer sur le serveur. Une personne qui met 10 commentaires en 2 minutes, c’est suspect. »

 José Marcio

 

Les antispams les plus fiables utilisés par les réseaux sociaux en ce moment d’après l’ACM (Association for Computing Machinery) mettent en collaboration les données relatives à plusieurs réseaux présentent plusieurs avantages.  

 

- Si un spam a été détecté sur un site les autres sont rapidement avertis.

- La précision de détection de spams augmente avec le nombre de données. 

- Les blacklits et « messages phisching » peuvent être centralisés.

- Les nouveaux réseaux peuvent directement se brancher au système et se protéger.

Des chercheurs pour nous défendre

Au-delà des logiciels anti-spam désormais omniprésent sur le Net, il est possible de ne plus être passif et de se lancer dans la recherche des spammeurs qui font intrusion dans notre réseau. Certains chercheurs s'y sont déjà attelés.

Dans l'article Detecting spammers on social networks nous apprenons que des chercheurs de l’université de Californie ont développé un logiciel permettant des détecter les spammers en s’appuyant sur une étude complète permettant de déterminer toutes leurs caractéristiques.

Ils ont donc commencé par créer 900 « honeynet accounts », 300 sur Facebook, 300 sur MySpace et 300 sur Twitter ce qui leur a permis, en observant l’activité des ces profiles de comprendre comment procédé un spammers et de mettre alors en place un système pour les détecter.
Il faut tout d’abord savoir que les spammers n’agissent pas de la même manière sur tous les réseaux sociaux car ceux-ci n’ont pas les mêmes caractéristiques. Facebook est un réseau social basé sur la confiance, les profiles ne sont habituellement pas public et peuvent être vu uniquement par ses « amis » (bien qu’ami n’ait pas la même définition que dans la vraie vie). Sur MySpace, les pages sont publiques par défaut, il est ainsi plus facile pour un utilisateur malveillant d’obtenir des informations que sur Facebook. En revanche, aucune information personnelle n’est accessible sur les pages Twitter par défaut. Pour connaître un utilisateur, il faut analyser ses tweets, ce qui n’est pas une mince affaire. Un utilisateur de Twitter peut commencer à en « suivre » un autre et ainsi il aura accès à tous ses tweets et si l’autre personne accepte elle peut suivre la première en retour. Une fois avoir analysé les différents réseaux sociaux, il faut comprendre comment collecter les données.
Dans ce but, 900 profiles ont été créé. Ceux-ci reflétant une population diverse en rejoignant des réseaux des divers continents. Pour chaque réseaux environ 2000 profiles ont été analysé (nom, âge, genre…) pour ensuite mélanger ces données et créer les « honey profiles ». Ces profiles ont ensuite étaient surveillés attentivement, et n’ont fait aucune « friend request » mais ont accepté toutes celles qu’on leur proposé. Les messages reçus par ces amis ont alors tous été analysés.
 

Il faut alors analyser ces données. Pour cette étude d’un an d’activité, un total de 4250 friend request a été reçu, la majorité sur Facebook (et la majorité des spams était sur twitter). Les comptes spam ont alors pu être identifiés.
Des caractéristiques précises ont ensuite étaient analysées : l’heure à laquelle il y a la plus de spam (GMT-7, minuit), le nombre de friends request qu’ils envoient, le nombre, s’il ya des liens dans leurs messages, si leurs message se ressemblent, s’ils envoient peu de messages, si leurs amis viennent d’une liste, s’ils ont peu d’amis…
Enfin, vient la détection des spammers. Le système est basé sur des chiffres caractéristiques mettant en évidence les caractères propres aux spammers évoqués ci-contre.

 

Les programme mis en place est très efficace : seulement 2% de faux positif et 1% de faux négatif pour une étude faites sur 1000 profiles sur Facebook ; seulement 2,5% de faux positif et 3% de faux négatif pour une étude faites sur 500 profiles sur Twitter. De plus, ce programme a été proposé a Twitter et, pendant 3 mois, de Mars à Juin 2010, 135834 profiles ont été analysé et 15932 ont été reporté comme spammers avec seulement 75 faux positif d’après Twitter !

© spam social 2012 tous droits réservés
Fermer