Pouvez-vous expliquer intuitivement la différence entre l'apprentissage automatique, l'apprentissage profond et l'apprentissage par renforcement, comme l'expliquer à un enfant?


Réponse 1:

Il n'y a vraiment pas beaucoup de différence entre les trois, et il est probablement plus facile de ne pas trop transpirer les différences.

J'utilise rarement le terme «apprentissage en profondeur», préférant plutôt utiliser soit «apprentissage automatique», «modèle statistique», ou simplement «modèle».

Mais cela dit, selon l'âge de l'enfant et son intérêt pour le sujet, vous pouvez dire quelque chose comme ce qui suit en supposant qu'il ne sait pas grand-chose sur le fonctionnement des ordinateurs, mais qu'il est quelque peu intéressé par le sujet.

Apprentissage automatique

Exactement ce à quoi ça ressemble.

Tout comme vous pouvez apprendre de nouvelles choses en regardant des vidéos YouTube ou en lisant des livres, l'apprentissage automatique est lorsque les ordinateurs apprennent par eux-mêmes en regardant des vidéos YouTube spéciales et en lisant des livres spéciaux conçus pour les ordinateurs.

Les programmeurs doivent encore dire à l'ordinateur comment apprendre, mais ils n'ont pas besoin de dire à l'ordinateur comment faire tout ce qu'ils apprennent, ce qui est souvent beaucoup plus difficile.

Imaginez par exemple, il m'est beaucoup plus facile de vous dire d'étudier le japonais en regardant des vidéos YouTube que de vous enseigner le japonais (principalement parce que je ne parle pas japonais).

L'apprentissage en profondeur

L'apprentissage profond est un type spécial d'apprentissage automatique.

Imaginez que vous vouliez apprendre à battre un niveau dans Mario. Vous voudrez peut-être mesurer vos progrès en examinant le nombre de points que vous parvenez à accumuler pendant une course.

Plus vous accumulez de points, mieux vous avez fait.

Le but est bien sûr d'accumuler autant de points que possible.

L'apprentissage en profondeur fonctionne de la même manière. L'ordinateur essaie d'apprendre à accumuler autant de points que possible en essayant différentes choses.

Il y a aussi quelque chose appelé "algorithmes évolutionnaires" où l'ordinateur essaie également de maximiser son score, mais il le fait en devinant au hasard sur quels boutons appuyer, et s'en tient à ce qui fonctionne.

L'apprentissage en profondeur est plus intelligent et peut théoriser sur ce qu'il devrait faire différemment pour battre le patron.

Apprentissage par renforcement

L'apprentissage par renforcement est également un type d'apprentissage automatique et peut être un peu différent selon la façon dont vous l'utilisez.

Mais généralement, cela fonctionne principalement comme l'apprentissage en profondeur dans l'exemple ci-dessus où vous contrôlez un personnage.

L'apprentissage en profondeur est plus général et peut également être utilisé pour des choses comme déterminer ce qu'il y a dans une image.

Ces explications souffrent d'une simplification excessive et ne sont que des demi-vérités qui sont nécessaires pour simplifier à ce point, mais je crois que ces explications ont une certaine utilité.

Dans la plupart des cas, cependant, les trois se mélangent, et comme je l'ai mentionné au début de la réponse, ce n'est pas très important ce que vous appelez.