Illustration
Illustration

Welcome to the jungle[STAGE] ANOMALY DETECTION IN MULTIVARIATE TIME SERIES WITH GANs

TotalEnergies Digital Factory
Github
Python
Deep Learning
Machine Learning
PySpark
Intelligence artificielle
Data science
Pytorch
Rigueur
Paris, Île-de-France
Télétravail : partial
Expérience : LESS_THAN_6_MONTHS
internship
Publié il y a 2 mois

Description du poste

Tu seras intégré(e) à la Data Team de la TotalEnergies Digital Factory (TDF), composée de plusieurs dizaines de Data Scientists qui participent à la construction de solutions d'aide à la décision basées sur les technologies de pointe dans l'IA, e.g. Machine Learning, Optimisation, Computer Vision pour tous les métiers de la compagnie. Tu seras rattaché(e) directement à un Data Scientist de l'équipe pour étudier et cadrer l'usage de nouvelles technologies dans ce contexte.

L'objectif de ce stage est d'étudier et d'évaluer l'apport des GANs (Generative Adversarial Networks) dans la détection d'anomalies sur les turbines éoliennes à partir des données capteurs.

La détection d'anomalies dans les capteurs éoliens est cruciale pour la maintenance prédictive et l'optimisation des performances des turbines éoliennes. Les GANs offrent une approche prometteuse pour cette tâche. Cependant, il est essentiel de tester cette technologie dans ce contexte spécifique et de l'améliorer ou explorer d'autres pistes si nécessaire. Une approche alternative pourrait consister à encoder les variables temporelles dans une image pour mieux capturer les anomalies.

Dans ce contexte, l'objectif principal est d'étudier et comparer les différentes méthodes de détection d'anomalies (classiques et basées sur les GANs) et d'explorer des approches alternatives si nécessaire. Les éléments suivants seront prépondérants pour arriver à l'objectif principal :

  • Veille scientifique sur les différentes méthodes de détection d'anomalies basées sur les GANs / AEs / ML
  • Conceptualisation et production de code pour l'application des méthodes
  • Création de POCs avec des données de capteurs des turbines éoliennes réelles

  • Comparaison avec des approches de détection d'anomalies traditionnelles
  • Mise en place d'un protocole de mesure de la performance rigoureux pour pouvoir conclure à la fin de la pertinence d'un approche complexe de Deep Learning vs une approches ML « classique ».

  • S'impliquer dans les activités transverses de l'équipe Data, en collaborant avec d'autres membres de l'équipe pour participer à l'animation de la communauté globale de la Data chez TotalEnergies.

Pourquoi utiliser des GANs pour la détection d'anomalies ?

Nous cherchons à adopter une approche non supervisée pour générer un score d'anomalie à partir d'un grand nombre de capteurs (plus de 50 à 100), et nous voulons que cette méthode soit suffisamment généralisable pour s'appliquer à différents contextes. Actuellement, les approches traditionnelles rencontrent des difficultés à gérer les problèmes de non-linéarité dans les relations complexes entre plusieurs séries temporelles. En général, les techniques classiques comparent une prédiction avec l'état actuel, ce qui fonctionne bien dans de nombreux cas, mais reste limité dans des scénarios plus complexes.

Pourquoi alors choisir un GAN (Generative Adversarial Network) ? La force de cette approche réside dans son architecture "deux en un". Le GAN se compose de deux parties : un discriminateur et un générateur (ou reconstructeur). Le discriminateur aide à identifier si une donnée est anormale ou non, tandis que le générateur produit un score d'anomalie, qui indique à quel point l'exemple est éloigné de la distribution normale. Cette dualité permet d'obtenir à la fois une détection de problème (via le discriminateur) et un score d'anomalie (via le générateur), offrant ainsi une approche plus complète que les méthodes classiques de type AutoEncoder, qui se basent uniquement sur le score de reconstruction.

Vous évoluerez au sein d'une équipe de professionnels confirmés et auprès d'un tuteur-coach, le référent de votre futur métier. Un accompagnement individualisé vous permettra de favoriser votre autonomie et de vous mener à votre diplôme !

Actuellement en école d'ingénieur ou en Master dans le domaine de la Data et de l'Intelligence Artificielle, vous recherchez un stage de fin d'étude d'une durée de 6 mois à partir de février 2025 ?

Techniques :

  • Data Science/Machine Learning/Deep Learning
  • Mathématiques avancées
  • Traitement du signal

Informatiques :

  • Python
  • Github
  • PyTorch

Savoir-être :

  • Bienveillance
  • Rigueur
  • Travail d'équipe
  • Capacités d'analyse et de synthèse

Langues vivantes :

  • Anglais courant
  • Français courant

Référence :

Repo :

Alors n'attend plus, postule pour rejoindre notre équipe !

A propos de l'entreprise

TotalEnergies Digital Factory, Paris ()

La Digital Factory de TotalEnergies a été créée en 2020.
Après trois ans, la Digital Factory est entrée dans une phase d’accélération : plus de solutions, plus de qualité, plus de valeur ajoutée technologique, plus de déploiement des solutions au sein de la Compagnie.

Nos missions ?
Développer des solutions digitales dans tous les domaines, Accélérer en mode agile partout dans le monde, Transformer nos façons de travailler, penser, agir, décider et collaborer différemment.

Implantée à Paris au plus près de l’écosystème tech, la Digital Factory rassemble 300 expert(e)s - Data Scientists, UX Designers, Software Ingénieur, Technical Leaders … - pour accélérer la digitalisation de la Compagnie.

Vous êtes partants ? Rejoignez-nous à la Digital Factory.

À propos de TotalEnergies
TotalEnergies est une compagnie multi-énergies mondiale de production et de fourniture d’énergies : pétrole et biocarburants, gaz naturel et gaz verts, renouvelables et électricité. Ses plus de 100 000 collaborateurs s’engagent pour une énergie toujours plus abordable, plus propre, plus fiable et accessible au plus grand nombre. Présente dans près de 130 pays, TotalEnergies inscrit le développement durable dans toutes ses dimensions au cœur de ses projets et opérations pour contribuer au bien-être des populations.