L’approche MASA pour l’Apprentissage Machine
On entend communément par Apprentissage Machine toute technique servant à extraire des informations de façon automatique à partir d’un ensemble de données. Les informations extraites peuvent avoir une expression concrète sous la forme de formules mathématiques, d’ensembles de propositions logiques ou d’une structure associée aux données analysées.
MASA développe des algorithmes d’apprentissage machine fondés sur l’analyse statistique de données numériques.
Les informations extraites sont représentées sous la forme de modèles mathématiques : des fonctions, et l’approche est applicable aux problèmes pour lesquels les entrées peuvent être représentées par des ensembles de vecteurs (ce qui englobe un très large champ d’applications). Le travail de recherche et développement réalisé par MASA depuis 2001 se concentre sur la création et l’utilisation d’algorithmes d’apprentissage et sur l’étude des méthodes d’évaluation du risque statistique associé aux modèles.
La librairie BK Machine Learning
La librairie BlueKaizen – Machine Learning est un ensemble d’outils d’apprentissage statistique. Elle permet à MASA de traiter les paradigmes d’apprentissage suivants : Classification Supervisée, Clustering, Régression et Détection de Nouveauté. De plus, cette librairie contient des outils destinés au pré-traitement des données et à l’évaluation de la « qualité » (risque statistique) d’un modèle, essentiel pour réaliser la sélection automatique de modèles. Ces deux derniers outils s’attaquent à des problématiques communes (sujets horizontaux) à tous les paradigmes d’apprentissage (sujets verticaux) mentionnés plus haut. Ce cadre de recherche est schématisé dans la figure suivante :

La librairie BlueKaizen – Machine Learning a les caractéristiques suivantes :
- Architecture : l’architecture générale de la librairie est modulaire. Chaque famille d’algorithmes peut fonctionner indépendamment des autres.
De cette façon, les boîtes à outils algorithmiques peuvent évoluer très rapidement du point de vue informatique.
La combinaison de plusieurs algorithmes est possible et sa mise en place est simple.
- Environnement de développement : le coeur de la librairie est programmé en C++ qui est donc l’environnement de développement le plus « naturel ».
Cependant, des couches logicielles spécifiques (« bridges ») permettent d’utiliser aisément la librairie dans des environnements de développement standards de plus haut niveau tels que Matlab ou Python, par exemple.
- Livraison des composants : l’architecture de la librairie est conçue de façon à permettre la création et le packaging de librairies personnalisées : chaque client reçoit une librairie sur mesure ne contenant que les modules indispensables à son application et peut définir des interfaces spécifiques pour brancher le composant BlueKaizen à son environnement logiciel.
Les produits
Les premières applications industrielles envisagées par MASA pour la librairie Machine Learning, se concentrent sur des problématiques de contrôle de procédés et suivi de qualité, en particulier pour le secteur de la microélectronique et des semi-conducteurs.
Les solutions BlueKaizen – Machine Learning on été testées sur des problèmes de Détection et Classification de Défauts (FDC), de Surveillance et Détection de Dérives dans des Equipements (Monitoring) et de Contrôle de Processus Avancé (SPC/APC).
English Version
