Roadmap

Roadmap scientifique et technique

Projets de Recherche & Développement plannifiés sur les 24 prochains mois

 


  

Q2-2018

Supervised Models - Modèles de régression

Ces modèles ont pour objectif de prédire une variable numérique. Grâce à l’approche MODL, les modèles de régression seront robustes et optimisés analytiquement (pas de grid-search).

 

Q3-2018

Supervised Models - IHM web

L’approche MODL fournit des modèles interprétables, qui facilitent les interactions avec les métiers. Une interface web permettant de visualiser et d’interpréter les modèles sera développée.

 

Q4-2018

Supervised Models - Gradient Boosting Machine

Le GBM est une approche ensembliste qui empile des modèles apprenant l’erreur des précédents, dans le but de la corriger. Grâce à l’approche MODL, il est possible d’implémenter un GBM sans paramètre, dont l’empilement des modèles s’arrête automatiquement. Ainsi, les modèles fournis par Edge ML gagneront encore en précision, sans sacrifier leur robustesse.

 

2019

Auto Feature Engineering - Co-clustering

L’objectif du co-clustering est de regrouper conjointement les modalités de deux variables catégorielles. L’approche MODL étend le co-clustering aux variables numériques et optimise le choix du nombre de groupes. Cette approche peut être utilisée comme prétraitement d’un modèle supervisé.

 

2019

Auto Feature Engineering - Tri-clustering et séries temporelle

L’approche MODL étend le co-clustering à un nombre de variables arbitraire. Le tri-clustering peut être appliqué aux séries temporelles encodées par les variables suivantes :

  1. identifiant de la série
  2. timestamp
  3. valeur du point de mesure

Ainsi les séries temporelles sont partitionnées en groupes et chaque groupe est décrit par la distribution de points de mesure au cours du temps. Cette approche permet de caractériser les séries temporelles en amont d’un modèle supervisé.

 

2020

Auto Feature Engineering - Représentation symbolique SAXO

Il s’agit d’une variante « hiérarchique » du tri-clustering MODL qui permet d’encoder de manière optimale un ensemble de séries temporelles par des séquences de symboles. Cette approche permet de préparer automatiquement des séries temporelles en amont d’un modèle supervisé.