Trace Software
Blog

Comment l’IA permet-elle de nettoyer vos données de consommation ?

Technique

30 août 2024

Chez Green Systèmes, nous travaillons sur l’automatisation des tâches redondantes et chronophages. C’est pourquoi nous réalisons énormément de recherches dans les intelligences artificielles (IA). Analyses de courbes énergétiques, détections d’anomalies, prévisions de consommations, tout cela peut être réalisé grâce à l’apprentissage machine (machine learning). Bien que les possibilités soient vastes et variées, elles partagent un point commun : la donnée.

La donnée est le nerf de la guerre lorsque l’on parle d’intelligence artificielle (IA). D’autant plus que chez Green Systèmes, nos recherches impliquent régulièrement les réseaux de neurones artificiels, dit « apprentissage profond ». Ce type de machine learning est particulièrement gourmand, et requiert de la donnée en quantité et en qualité.

Nous possédons la quantité de données nécessaires pour entraîner ce type d’algorithme, mais le processus de nettoyage de la donnée est long et redondant. C’est pourquoi nous avons créé un “robot nettoyeur de données” : le Data Cleaner. Cet outil est capable de déterminer avec une précision parfaite les données dites « aberrantes » : un relevé de consommation négatif, une température de chambre froide trop élevée, une valeur multipliée par un facteur 10…

Pourquoi utiliser l’ intelligence artificielle (IA) pour  analyser, nettoyer la donnée ?

Il est vrai que l’on peut se poser la question. Après tout, il est plus simple d’énoncer un ensemble de règles manuellement (« une température de chambre froide ne doit pas dépasser une certaine valeur » ou « une courbe de charge ne peut comprendre de valeurs négatives ») alors pourquoi entraîner un robot à déterminer ces règles de lui-même ?

Ces cas extrêmes sont en effet aisément excluables par des règles simples, mais qu’en est-il des autres cas ? Quelle est la limite selon laquelle une valeur sera aberrante ou non ? Une consommation 10 fois au-dessus de sa moyenne l’est-elle ? Et si elle n’est que 5 fois au-dessus ? Ou 4,756 fois au-dessus ? Peut-être l’est-elle aujourd’hui mais ne le sera pas demain. Peut-être l’est-elle pour la société A, mais pas pour la société B…

Lorsque l’on arrive dans ce genre de cas de figure, il est nécessaire de prendre le contexte en compte, ce que fait extrêmement bien une intelligence artificielle (IA), tandis qu’un ensemble de règles mathématiques peine terriblement.

Perspectives d’avenir – IA

Comme stipulé précédemment, la précision de notre robot a dépassé toutes nos attentes. Sur les quelques millions de données de test (c’est-à-dire des données nouvelles pour lui, sur lesquelles il ne s’est jamais entrainé), sa précision est pour l’instant sans faille.

Nous l’utilisons déjà en interne dans les projets de recherche et développement impliquant du « big data », mais nous prévoyons de l’implémenter dans notre logiciel d’optimisation énergétique prochainement.

De plus, ce projet s’inscrit dans la démarche d’un projet de plus grande envergure, le Preprocessor. Ce projet est encore à un stade de recherche, mais nous réfléchissons à la manière dont nous pourrions avoir une donnée le plus proche possible de la perfection. Utiliser des outils de détection de valeurs frauduleuses couplés à des algorithmes permettant de les remplacer par une prédiction de la donnée réelle nous semble une excellente direction à prendre.