Nous entrons dans une période pionnière, alimentée par les progrès de la robotique, l'adoption d'appareils domestiques intelligents, les magasins de détail intelligents, la technologie des véhicules autonomes, etc. L'apprentissage automatique est à la pointe de toutes ces avancées technologiques du nouvel âge. Le développement de machines automatisées capables d'égaler voire de surpasser l'intelligence humaine dans les années à venir. L'apprentissage automatique est sans aucun doute la prochaine "grande" chose. Et on pense que la plupart des technologies futures y seront connectées.
Pourquoi l'apprentissage automatique est-il important ?
L'apprentissage automatique revêt une grande importance car il aide à prédire les comportements et à détecter les modèles que les humains ne parviennent pas à prédire. L'apprentissage automatique a une grande variété d'applications pratiques très utiles. Grâce à l'apprentissage automatique, il est possible de gérer des scénarios autrefois déroutants.
3 leçons révolutionnaires en apprentissage automatique
Les algorithmes d'apprentissage automatique peuvent trouver des moyens d'accomplir les tâches nécessaires simplement en généralisant à partir de scénarios. C'est plus pratique et rentable, tandis que la programmation manuelle n'est pas aussi rentable ou faisable. La quantité croissante de « données disponibles » est susceptible d'entraîner davantage de problèmes liés aux données capturées. Par conséquent, l'apprentissage automatique est quelque chose d'avenir, car il sera largement utilisé en informatique et dans d'autres domaines. Cependant, le développement d'applications d'apprentissage automatique efficaces nécessite une quantité considérable de "dark art" qui n'est pas si facile à trouver dans les manuels.
Les 6 leçons d'apprentissage automatique les plus précieuses sont répertoriées ci-dessous :
1.La généralisation est au cœur
L'une des caractéristiques les plus fondamentales de l'apprentissage automatique est que l'algorithme le fait généraliser à partir des données de la formation dans le domaine complet de tous les scénarios non publiés dans le domaine afin que vous puissiez faire les extrapolations correctes pour ce que vous utilisez le modèle. Ce processus de généralisation nécessite que les données que nous utilisons pour former le modèle soient un échantillon décent et fiable des interprétations de cartographie que nous voulons que l'algorithme apprenne. Plus la qualité et la représentativité sont élevées, plus il est facile pour le modèle de comprendre la « vraie » correspondance non identifiée sous-jacente entre les entrées et les sorties. La généralisation est le fait de passer de quelque chose de spécifique à quelque chose de large.
Les algorithmes d'apprentissage automatique sont les techniques permettant de simplifier automatiquement à partir de scénarios historiques. Ils ont la capacité de généraliser sur une plus grande quantité de données et une vitesse plus rapide.
L'erreur la plus générale que tous les débutants en apprentissage automatique ont tendance à faire est de tester les données d'entraînement, et jusqu'à ce que vous vous sentiez réussi. Si le classificateur sélectionné est ensuite testé sur de nouvelles données, ce n'est généralement pas mieux qu'une estimation aléatoire. Donc, si vous demandez à quelqu'un de développer un classificateur, assurez-vous d'apporter des données avec vous. Essayez également d'essayer le classificateur qu'il vous donne sur ceux-ci.
2. Apprentissage = Représentation + Évaluation + Optimisation
Un algorithme ML est divisé en 3 parties ; représentation, évaluation et optimisation.
Représentation : Les données doivent être rendues sous une forme algorithmique appropriée. Pour la classification de texte, on peut extraire des caractéristiques de ses entrées de texte intégral et les mouler en une représentation en sac de mots. Au contraire, le choix d'une représentation est synonyme du choix de l'ensemble des classificateurs qu'elle peut éventuellement apprendre. Cet ensemble est appelé l'espace des hypothèses de l'élève.
Évaluation : Il s'agit d'une mesure qui nous aide à comprendre ce que nous faisons en ce moment. Un processus d'évaluation est nécessaire pour différencier les bons classificateurs des moins bons.
Optimisation : il s'agit du processus consistant à trouver des moyens de sélectionner diverses techniques pour l'optimiser. Par exemple, nous pouvons simplement tester toutes les hypothèses dans notre espace d'hypothèses. Alternativement, nous pouvons également choisir d'utiliser une technique beaucoup plus intelligente pour tester uniquement l'hypothèse la plus favorable. De plus, lors de l'optimisation, nous pouvons utiliser la fonction d'évaluation pour comprendre si cette hypothèse spécifique est bonne ou non. La technique d'optimisation permet à l'utilisateur d'en savoir plus sur le classificateur créé si la fonction d'évaluation a obtenu plus d'un optimum. Les débutants doivent d'abord commencer par des optimiseurs prêts à l'emploi, puis passer à ceux conçus sur mesure.
3. Les données seules ne peuvent pas faire le travail !
La généralisation est l'objectif principal, cependant, il est très préoccupant que les données seules ne suffisent pas, quelle qu'en soit la quantité. Heureusement, cependant, les fonctions que nous voulons maîtriser ne sont pas uniformément tirées de l'ensemble des fonctions arithmétiquement possibles! Même les hypothèses les plus générales, y compris la régularité, des exemples similaires ayant des classes analogues, des dépendances inappropriées ou une complexité restreinte, sont généralement suffisantes pour bien fonctionner, et c'est l'une des principales raisons pour lesquelles l'apprentissage automatique est si puissant. Fondamentalement, tous les débutants syndiquent les connaissances avec big data pour produire des programmes.