Machine Learning

Le Machine Learning est à bien des égards le croisement de deux disciplines : la science des données et le génie logiciel. L’objectif du Machine Learning est l’utilisation des données pour créer un modèle prédictif pouvant être incorporé dans une application logicielle ou un service. Pour atteindre cet objectif, il faut une collaboration entre les experts en science des données qui explorent et préparent les données, avant de les utiliser pour entraîner un modèle Machine Learning, et les développeurs de logiciels qui intègrent les modèles dans des applications où ils servent à prédire de nouvelles valeurs de données (processus connu sous le nom d’inférence).L’idée fondamentale du Machine Learning est d’utiliser les données des observations passées pour prédire des résultats ou des valeurs inconnus.

Machine learning supervisé

Le Machine Learning supervisé est un terme général pour des algorithmes de Machine Learning dans lesquels les données d’apprentissage comprennent à la fois des valeurs de fonctionnalité et des valeurs d’étiquette connues. Le Machine Learning supervisé sert à entraîner des modèles, en déterminant une relation entre les caractéristiques et les étiquettes dans les observations passées, afin que des étiquettes inconnues puissent être prédites pour des fonctionnalités des futurs cas.

Régression

La régression est une forme de Machine Learning supervisé dans laquelle l’étiquette prédite par le modèle est une valeur numérique.

Les modèles de régression sont entraînés pour prédire des valeurs d’étiquette numérique en fonction des données d’entraînement qui comprennent à la fois des caractéristiques et des étiquettes connues. Le processus d’entraînement d’un modèle de régression (ou de tout modèle Machine Learning supervisé) implique plusieurs itérations dans lesquelles vous utilisez un algorithme approprié (généralement avec des paramètres paramétrisables) pour entraîner un modèle, évaluer les performances prédictives du modèle et affiner le modèle en répétant le processus d’entraînement avec différents algorithmes et paramètres jusqu’à atteindre un niveau acceptable de précision prédictive.

Métriques d’évaluation de régression

En fonction des différences entre les valeurs prédites et réelles, vous pouvez calculer certaines métriques courantes utilisées pour évaluer un modèle de régression.

Erreur absolue moyenne (MAE)

L’écart dans cet exemple indique la différence de nombre de glaces pour chaque prédiction. Peu importe que la prédiction soit supérieure ou inférieure à la valeur réelle (par exemple, -3 et +3 indiquent un écart de 3). Cette métrique est appelée erreur absolue pour chaque prédiction et peut être totalisée pour l’ensemble du jeu de validation en erreur absolue moyenne (MAE).

Erreur carrée moyenne (MSE)

La métrique d’erreur absolue moyenne prend en compte toutes les différences entre les étiquettes prédites et réelles de manière égale. Toutefois, vous pouvez préférer un modèle qui a régulièrement un écart d’une petite quantité qu’un modèle qui fait moins d’erreurs, mais plus grandes. Une des façons de produire une métrique qui « amplifie » les plus grandes erreurs est de mettre au carré les erreurs individuelles et de calculer la moyenne des valeurs au carré. Cette métrique est appelée erreur carrée moyenne (MSE).

Entraînement itératif

Les métriques décrites ci-dessus sont couramment utilisées pour évaluer un modèle de régression. Dans la plupart des scénarios réels, un scientifique des données utilise un processus itératif pour entraîner et évaluer un modèle de façon répétitive, en faisant varier :La sélection et la préparation des caractéristiques (choix des caractéristiques à ajouter dans le modèle et calculs qui leur sont appliqués pour garantir un meilleur ajustement).
La sélection d’algorithmes (Nous avons exploré la régression linéaire dans l’exemple précédent, mais il existe de nombreux autres algorithmes de régression)
Les paramètres d’algorithme (paramètres numériques pour contrôler le comportement de l’algorithme, plus précisément appelés hyperparamètres pour les différencier des paramètres x et y ).

Après plusieurs itérations, le modèle qui aboutit à la meilleure métrique d’évaluation acceptable pour le scénario spécifique est sélectionné.

Classification

La classification est une forme de Machine Learning supervisé dans laquelle l’étiquette représente une catégorisation ou une classe. Il existe deux scénarios courants de classification.

Classification binaire

Dans la classification binaire, l’étiquette détermine si l’élément observé est (ou non) l’instance d’une classe spécifique.

Classification multiclasse

La classification multiclasse étend la classification binaire pour prédire une étiquette qui représente l’une des nombreuses classes possibles.
La classification multiclasse est utilisée pour prédire les possibles classes d’appartenance d’une observation. En tant que technique de Machine Learning supervisée, elle suit le même processus itératif d’apprentissage, de validation et d’évaluation que la régression et la classification binaire dans lesquelles un sous-ensemble des données d’entraînement est retenu pour valider le modèle entraîné.

Machine learning non supervisé

Le Machine Learning non supervisé implique l’apprentissage de modèles à l’aide de données qui se composent uniquement des valeurs de caractéristiques sans étiquette connue. Les algorithmes Machine Learning non supervisés déterminent les relations entre les caractéristiques des observations dans les données d’apprentissage.

Clustering

La plus courante forme de Machine Learning non supervisé est le clustering. Un algorithme de clustering identifie les similitudes entre les observations, en fonction de leurs caractéristiques, et les regroupe en clusters discrets.

Dans certains cas, le clustering sert à déterminer l’ensemble des classes qui existent avant l’apprentissage d’un modèle de classification.

Apprentissage approfondi

Deep Learning est une forme avancée de Machine Learning qui tente d'imiter la façon dont le cerveau humain apprend. La clé du Deep Learning est la création d’un réseau neuronal artificiel qui simule l’activité électrochimique dans les neurones biologiques à l’aide de fonctions mathématiques

Tout comme d’autres techniques de Machine Learning décrites dans ce module, le Deep Learning implique l’adaptation des données d’entraînement à une fonction qui peut prédire une étiquette (y) en fonction de la valeur d’une ou plusieurs caractéristiques (x). La fonction (f(x)) est la couche externe d’une fonction imbriquée dans laquelle chaque couche du réseau neuronal encapsule des fonctions qui opèrent sur x et les valeurs de poids (w) qui leur sont associées. L’algorithme utilisé pour entraîner le modèle implique une alimentation itérative des valeurs des caractéristiques (x) dans les données d’entraînement à travers les couches afin de calculer les valeurs de sortie pour ŷ, une validation du modèle pour évaluer la distance entre les valeurs ŷ calculées et les valeurs y connues (ce qui quantifie le niveau d’erreur ou de perte dans le modèle), puis une modification des poids (w) pour réduire la perte. Le modèle entraîné contient les valeurs de poids finales qui aboutissent aux prédictions les plus exactes.

Microsoft Azure Machine Learning est un service cloud pour l’entraînement, le déploiement et la gestion des modèles Machine Learning. La ressource principale requise pour Azure Machine Learning est un espace de travail Azure Machine Learning que vous pouvez provisionner dans un abonnement Azure. Une fois un espace de travail Azure Machine Learning provisionné, vous pouvez l’utiliser dans Azure Machine Learning studio, un portail web pour la gestion de vos ressources et travaux Machine Learning. https://ml.azure.com,

Commentaires

Posts les plus consultés de ce blog

Sécurité des Applications

Principes de la Programmation Orientée Objet

Principe de Responsabilité Unique