Les filtres anti-spam traditionnels à l'ère du spam basé sur l'IA
Plus de 45 % de tous les e-mails dans le monde sont des spams (Statista), mais le principal problème est que tous ces messages indésirables sont bien plus dangereux qu'auparavant. Les spammeurs modernes utilisent l'intelligence artificielle (IA) pour rédiger des messages convaincants avec une grammaire parfaite, un contenu personnalisé et un texte habilement obscurci qui échappe aux filtres traditionnels basés sur des mots-clés.
Heureusement, les géants de la technologie comme Google ripostent avec leur propre technologie de filtrage anti-spam basée sur l'IA. Cet article a pour but de vous aider à comprendre comment fonctionnent ces systèmes avancés, quels sont les défis qui restent à relever et quelles mesures pratiques vous pouvez prendre pour sécuriser votre boîte de réception.
Pendant des décennies, les fournisseurs de messagerie électronique se sont appuyés sur des méthodes conventionnelles de filtrage anti-spam qui fonctionnaient raisonnablement bien contre les courriers indésirables prévisibles, basés sur des modèles. Voici quelques-uns des éléments clés que vous devez connaître pour comprendre le fonctionnement des filtres anti-spam traditionnels :
- Recherche de signaux d'alerte évidents tels que « ARGENT GRATUIT », « Agissez maintenant » ou utilisation excessive de majuscules et de points d'exclamation.
- Bloquer les domaines et adresses IP connus pour envoyer des spams tout en autorisant automatiquement les expéditeurs de confiance.
- Utiliser l'analyse statistique pour calculer la probabilité qu'un e-mail soit un spam en fonction de la fréquence des mots observée dans les messages spam précédents.
- Appliquer des conditions statiques « si-alors » (si l'expéditeur est inconnu + pièce jointe présente + certains mots clés = spam).
- Vérification des détails techniques tels que l'authentification de l'expéditeur, les informations de routage et le formatage du message à la recherche de modèles suspects.
Malheureusement, le spam basé sur l'IA a rendu bon nombre de ces méthodes traditionnelles obsolètes. Les spammeurs d'aujourd'hui utilisent des modèles d'IA de pointe pour générer des messages impossibles à distinguer de ceux rédigés par de vraies personnes. Ils intègrent souvent des informations récupérées sur les réseaux sociaux afin de donner l'impression que ces messages proviennent de contacts fiables ou font référence à des événements réels dans la vie de leurs cibles.
Une autre raison pour laquelle les utilisateurs sont si souvent confrontés à un afflux soudain de courriers indésirables est que les spammeurs ont trouvé de nouveaux moyens basés sur l'IA pour contourner les mesures de sécurité utilisées par les services de messagerie légitimes pour prévenir les abus. Par exemple, ils peuvent résoudre des CAPTCHA à grande échelle à l'aide de la vision par ordinateur, générer des adresses électroniques uniques qui contournent les systèmes de réputation des domaines, et même créer des profils d'expéditeurs réalistes, avec des photos de profil générées par l'IA.
Comment les filtres anti-spam modernes basés sur l'IA ripostent
Si les spammeurs ont fait de l'intelligence artificielle leur arme, les fournisseurs de messagerie électronique ne sont pas restés les bras croisés. Prenons l'exemple de Google, qui traite plus de 15 milliards de messages indésirables par jour, pour illustrer comment la détection des spams par apprentissage automatique peut garder une longueur d'avance sur les menaces en constante évolution. Ces dernières années, le géant technologique a mis en œuvre plusieurs technologies et stratégies Gmail spécifiques pour protéger ses 1,8 milliard d'utilisateurs contre la vague croissante de spams générés par l'IA.
Détection de texte obscurci avec RETVec
Comme l'explique Ars Technica, le Resilient & Efficient Text Vectorizer (RETVec) de Google est un filtre anti-spam basé sur l'IA qui peut détecter les textes délibérément mal orthographiés et manipulés que les filtres traditionnels ne détectent pas (comme « fr€€ w1nn3r » ou « V!agra »).
« RETVec est entraîné à résister aux manipulations au niveau des caractères, notamment les insertions, les suppressions, les fautes de frappe, les homoglyphes, les substitutions LEET, etc. », explique Google, soulignant que le système y parvient tout en étant suffisamment efficace sur le plan informatique pour fonctionner à l'échelle massive de Gmail.
RETVec a aidé Gmail à détecter 38 % de spam en plus tout en réduisant les faux positifs de 19,4 %. Cette amélioration spectaculaire signifie que moins d'e-mails légitimes se retrouvent dans votre dossier spam, tandis que davantage de courriers indésirables sont interceptés.
Intégration de TensorFlow
L'intégration de TensorFlow, le framework open source de machine learning de Google, dans Gmail a permis à la plateforme de bloquer 100 millions de messages indésirables supplémentaires chaque jour. « Grâce à TensorFlow, nous bloquons désormais environ 100 millions de messages indésirables supplémentaires chaque jour », écrit Neil Kumaran, chef de produit chez Gmail Security & Trust.
Les modèles TensorFlow excellent dans la détection des spams basés sur des images, où le texte est intégré dans des images pour éviter les filtres de texte, et ils peuvent identifier les tentatives de phishing qui imitent des services légitimes avec une précision étonnante.
Détection des escroqueries en temps réel
Grâce à Gemini Nano, le modèle linguistique volumineux intégré aux appareils de Google, les utilisateurs bénéficient d'une protection même contre les escroqueries que Google n'a jamais rencontrées auparavant.
Cette technologie serait particulièrement efficace contre les escroqueries liées à l'assistance technique à distance, l'une des menaces les plus courantes auxquelles sont confrontés les utilisateurs aujourd'hui, où les escrocs se font passer pour des représentants légitimes du service d'assistance afin d'accéder aux ordinateurs et aux informations financières des victimes.
Filtrage des notifications
Au-delà des e-mails, Google a étendu sa technologie de filtrage anti-spam basée sur l'IA pour lutter contre le problème croissant des notifications push malveillantes. La société a récemment lancé des avertissements basés sur l'IA pour Chrome sur Android qui utilisent l'apprentissage automatique sur appareil pour identifier et bloquer les notifications frauduleuses, indésirables ou trompeuses avant qu'elles n'atteignent les utilisateurs.
Lorsque le système signale une notification suspecte, les utilisateurs reçoivent un avertissement leur proposant de se désabonner immédiatement ou de consulter le contenu bloqué. Il s'agit là d'un excellent exemple de la manière dont les mêmes techniques d'apprentissage automatique qui identifient les spams, les arnaques et les e-mails de phishing sont désormais appliquées à plusieurs canaux de communication.
Règles relatives aux expéditeurs en masse
En 2024, Google a mis en place de nouvelles exigences strictes pour les expéditeurs en masse (ceux qui envoient plus de 5 000 messages par jour à des adresses Gmail), marquant ainsi un changement de politique qui complète sa technologie d'IA. Depuis février 2024, les expéditeurs en masse sont tenus d'authentifier leurs messages, de faciliter les désabonnements et de s'assurer que leurs messages sont réellement souhaités.
Ce changement de politique a déjà porté ses fruits. De nombreuses plateformes marketing font état de listes d'adresses e-mail plus propres et de taux d'engagement améliorés, les entreprises supprimant les abonnés inactifs plutôt que de risquer d'être signalées en raison des règles anti-spam plus strictes.
Conseils pour améliorer encore la protection anti-spam de Gmail
Même les modèles avancés de Google ne sont pas parfaits. Les problèmes courants comprennent les faux positifs (e-mails légitimes marqués à tort comme spam) et les spams adversaires spécialement conçus pour contourner les modèles d'apprentissage automatique.
Voici comment améliorer la détection automatique des spams dans Gmail et exploiter pleinement ses fonctionnalités :
- Entraînez le filtre à l'aide de vos commentaires : marquez les messages comme « Non-spam » lorsque des e-mails légitimes se retrouvent dans votre dossier spam.


De plus, signalez toujours comme spam les messages indésirables qui arrivent dans votre boîte de réception. Ces commentaires contribuent directement à améliorer la précision du filtre anti-spam de Gmail pour votre compte.


- Configurez des filtres pour les expéditeurs importants : créez des filtres Gmail afin que les e-mails provenant de contacts VIP ou de newsletters fiables ne soient jamais classés comme spam.


Bien que vous puissiez le faire manuellement dans Gmail, les règles de Nettoyage Auto de Clean Email rendent ce processus plus pratique en vous permettant de créer des règles de filtrage complexes en quelques clics seulement.


- Soyez prudent avec les liens de se désabonner : ne cliquez jamais sur les liens de se désabonner contenus dans des e-mails suspects, car cela pourrait confirmer aux spammeurs que votre adresse e-mail est active. Utilisez plutôt un outil tel que Clean Email's Désabonnement, qui affiche tous vos abonnements e-mail dans un tableau de bord sécurisé où vous pouvez vous se désabonner en toute sécurité de plusieurs listes sans ouvrir d'e-mails potentiellement dangereux.


- Organisez vos e-mails à l'aide d'étiquettes et de catégories : une bonne organisation des e-mails aide le filtre anti-spam à apprendre vos préférences. Le système d'étiquetage de Gmail fonctionne bien, en particulier lorsqu'il est associé aux actions groupées de Clean Email, qui permettent de classer facilement des centaines d'e-mails à la fois afin d'apprendre à l'algorithme quels types de messages vous considérez comme importants et lesquels vous jugez inutiles.


- Ajoutez un niveau de filtrage supplémentaire : pour une protection optimale au-delà des défenses intégrées à Gmail, pensez à la fonctionnalité Filtre de Clean Email. Elle met automatiquement en quarantaine les e-mails provenant d'expéditeurs inconnus jusqu'à ce que vous les approuviez, bloquant ainsi efficacement les messages inconnus ou risqués avant même qu'ils n'atteignent votre boîte de réception. Cette fonctionnalité est donc parfaite pour ceux qui souhaitent contrôler entièrement la sécurité de leurs e-mails.


Au-delà de ces mesures techniques, la prévention la plus efficace contre le spam commence par la protection de votre adresse e-mail contre toute exposition. Soyez sélectif quant aux endroits où vous communiquez votre adresse e-mail principale et envisagez d'utiliser des adresses e-mail jetables ou la fonctionnalité d'alias « + » de Gmail (comme votrenom+shopping@gmail.com) lorsque vous vous inscrivez à des services auxquels vous ne faites pas entièrement confiance.
N'oubliez pas qu'une fois que les spammeurs ont votre adresse e-mail, aucun filtre n'est efficace à 100 %. La combinaison de la protection alimentée par l'IA de Gmail, des pratiques intelligentes de gestion de la boîte de réception et d'outils sécurisés tels que Clean Email pour un contrôle supplémentaire crée plusieurs niveaux de défense.
Conclusion
La course à l'armement de l'IA dans le domaine de la sécurité des e-mails ne montre aucun signe de ralentissement. Les spammeurs continueront à tirer parti des modèles d'IA les plus récents et les plus performants pour contourner les filtres, et les fournisseurs de messagerie électronique continueront à faire évoluer leurs défenses en réponse.
Quelle que soit l'issue de cette bataille technologique, la défense la plus efficace comprendra toujours plusieurs niveaux : des filtres IA sophistiqués pour détecter les menaces évidentes, la sensibilisation des utilisateurs pour prévenir les menaces subtiles et des outils de gestion intelligente de la boîte de réception tels que Clean Email pour traiter tout le reste.