Thèse de doctorat : « Deep Learning for Internet of Things (IoT) Network Security »

Télécom SudParis

L'Ecole doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris et le Laboratoire de recherche SAMOVAR - Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux présentent l’AVIS DE SOUTENANCE de Monsieur Mustafizur Rahman SHAHID, autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l'Institut Polytechnique de Paris, préparé à Télécom SudParis en : Informatique

« Deep Learning for Internet of Things (IoT) Network Security »

Le LUNDI 22 MARS 2021 à 10h00 (Soutenance en visio - Covid-19).

Membres du jury :

  • M. Hervé DEBAR, Professeur, Télécom SudParis - Institut Polytechnique de Paris, FRANCE - Directeur de thèse
  • M. Gregory BLANC, Maître de conférences, Télécom SudParis - Institut Polytechnique de Paris, FRANCE - Co-encadrant de thèse
  • M. Sébastien TIXEUIL, Professeur, Sorbonne Université, FRANCE - Rapporteur
  • M. Eric TOTEL, Professeur, IMT Atlantique, FRANCE - Rapporteur
  • M. Youki KADOBAYASHI, Professeur, Nara Institute of Science and Technology, JAPON - Examinateur
  • M. Thomas CLAUSEN, Professeur, École Polytechnique, FRANCE - Examinateur
  • Mme Cristel PELSSER, Professeure, Université de Strasbourg, FRANCE - Examinatrice
  • M. Urko ZURUTUZA, Maître de conférences, Mondragon University, ESPAGNE - Examinateur

Résumé :

L’internet des objets (IoT) introduit de nouveaux défis pour la sécurité des réseaux. La plupart des objets IoT sont vulnérables en raison d'un manque de sensibilisation à la sécurité des fabricants d'appareils et des utilisateurs. En conséquence, ces objets sont devenus des cibles privilégiées pour les développeurs de malware qui veulent les transformer en bots.

Contrairement à un ordinateur de bureau, un objet IoT est conçu pour accomplir des tâches spécifiques. Son comportement réseau est donc très stable et prévisible, ce qui le rend bien adapté aux techniques d'analyse de données. Ainsi, la première partie de cette thèse tire profit des algorithmes de deep learning pour développer des outils de surveillance des réseaux IoT.

Deux types d'outils sont explorés : les systèmes de reconnaissance de type d’objets IoT et les systèmes de détection d'intrusion réseau IoT. Pour la reconnaissance des types d’objets IoT, des algorithmes d'apprentissage supervisé sont entrainés pour classifier le trafic réseau et déterminer à quel objet IoT le trafic appartient. Le système de détection d'intrusion consiste en un ensemble d'autoencoders, chacun étant entrainer pour un type d’objet IoT différent. Les autoencoders apprennent le profil du comportement réseau légitime et détectent tout écart par rapport à celui-ci. Les résultats expérimentaux en utilisant des données réseau produites par une maison connectée montrent que les modèles proposés atteignent des performances élevées.

Malgré des résultats préliminaires prometteurs, l’entraînement et l'évaluation des modèles basés sur le machine learning nécessitent une quantité importante de données réseau IoT. Or, très peu de jeux de données de trafic réseau IoT sont accessibles au public. Le déploiement physique de milliers d’objets IoT réels peut être très coûteux et peut poser problème quant au respect de la vie privée. Ainsi, dans la deuxième partie de cette thèse, nous proposons d'exploiter des GAN (Generative Adversarial Networks) pour générer des flux bidirectionnels qui ressemblent à ceux produits par un véritable objet IoT. Un flux bidirectionnel est représenté par la séquence des tailles de paquets ainsi que de la durée du flux.

Par conséquent, en plus de générer des caractéristiques au niveau des paquets, tel que la taille de chaque paquet, notre générateur apprend implicitement à se conformer aux caractéristiques au niveau du flux, comme le nombre total de paquets et d'octets dans un flux ou sa durée totale. Des résultats expérimentaux utilisant des données produites par un haut-parleur intelligent montrent que notre méthode permet de générer des flux bidirectionnels synthétiques réalistes et de haute qualité.