Le Deep Learning (apprentissage profond) est inspiré du fonctionnement du cerveau humain. Tout comme notre cerveau est compose de milliards de neurones interconnectes, un réseau de neurones artificiel est compose de couches de "neurones" mathématiques qui traitent l'information.
Deep Learning (apprentissage profond) — Une forme avancée de Machine Learning qui utilise des réseaux de neurones à plusieurs couches pour traiter des données complexes comme les images, la voix ou le langage. C'est la base des IA modernes les plus puissantes.
Réseau de neurones — Un système informatique inspiré du cerveau humain, composé de milliers de « neurones » artificiels interconnectés qui transmettent des signaux. Plus le réseau a de couches, plus il peut apprendre des concepts complexes.
Chaque neurone artificiel reçoit des entrées, les multiplie par des poids, appliqué une fonction d'activation, et produit une sortie. C'est simple individuellement, mais la puissance émerge de la combinaison de millions de ces neurones en couches successives.
Un réseau de neurones typique comprend : une couche d'entrée (reçoit les données brutes), des couches cachées (traitent et transforment l'information), et une couche de sortie (produit le résultat final).
Réseau de neurones — Un système informatique inspiré du cerveau humain, composé de milliers de « neurones » artificiels interconnectés qui transmettent des signaux. Plus le réseau a de couches, plus il peut apprendre des concepts complexes.
Le "deep" dans "deep learning" fait référence au nombre de couches cachées. Plus il y a de couches, plus le réseau peut apprendre des représentations complexes et abstraites.
Les réseaux modernes comme GPT-5.4 peuvent avoir des centaines de couches et des trillions de paramètres. L'entraînement nécessite des milliers de GPU travaillant en parallèle pendant des semaines.
Entraînement (d'une IA) — Le processus par lequel une IA apprend à partir d'une grande quantité de données, un peu comme un étudiant qui révisé des milliers d'exercices avant un examen. Plus le jeu de données est grand, meilleur est le résultat.
Paramètres (d'un modèle IA) — Les millions ou milliards de réglages internes d'un modèle IA, ajustés pendant l'entraînement pour que l'IA donne de meilleures réponses. GPT-5 possède environ 1 000 milliards de paramètres.
GPT — Acronyme de « Generative Pre-trained Transformer » : la famille de modèles IA créée par OpenAI. GPT-3 (2020), GPT-4 (2023) et GPT-5.4 (2026) sont les versions successives. ChatGPT en est l'interface principale.
GPU (processeur graphique) — Un processeur spécialisé dans les calculs parallèles massifs, initialement conçu pour les jeux vidéo mais devenu indispensable pour entraîner les modèles IA. NVIDIA fabrique la majorité des GPUs utilisés en IA.
Trois facteurs ont converge pour révolutionner l'IA : 1) La disponibilité de données massives (Internet, smartphones). 2) La puissance de calcul (GPU, TPU). 3) Les avancées algorithmiques (Transformers en 2017).
Intelligence Artificielle (IA) — Un domaine de l'informatique qui crée des programmes capables de réaliser des tâches nécessitant normalement l'intelligence humaine : comprendre le langage, reconnaître des images, prendre des décisions.
Architecture Transformer — La structure technique inventée par Google en 2017 qui est à la base de tous les grands modèles de langage modernes (ChatGPT, Claude, Gemini…). Elle permet au modèle de comprendre le contexte complet d'un texte, et non mot par mot.
GPU (processeur graphique) — Un processeur spécialisé dans les calculs parallèles massifs, initialement conçu pour les jeux vidéo mais devenu indispensable pour entraîner les modèles IA. NVIDIA fabrique la majorité des GPUs utilisés en IA.
En 2012, AlexNet a démontré que le deep learning pouvait dominer la vision par ordinateur. Depuis, le deep learning a successivement révolutionné le NLP (traduction, génération de texte), la génération d'images (DALL-E, Midjourney), la video (Sora), et même la découverte scientifique (AlphaFold pour les proteines).
Deep Learning (apprentissage profond) — Une forme avancée de Machine Learning qui utilise des réseaux de neurones à plusieurs couches pour traiter des données complexes comme les images, la voix ou le langage. C'est la base des IA modernes les plus puissantes.
Midjourney — L'un des meilleurs outils de génération d'images IA, accessible via Discord ou son site web. Il transforme une description textuelle en image artistique en quelques secondes. Très apprécié pour sa qualité esthétique.
DALL-E — Le générateur d'images IA d'OpenAI, directement intégré dans ChatGPT. Il crée des images réalistes ou artistiques à partir d'une description en langage naturel.
NLP / Traitement du langage naturel — La branche de l'IA qui permet aux ordinateurs de comprendre, analyser et générer du texte humain (le « langage naturel »). Les LLMs sont la dernière avancée majeure dans ce domaine.
Vision par ordinateur — La capacité d'une IA à analyser et comprendre des images ou des vidéos : reconnaître des visages, détecter des objets, lire du texte dans une photo, diagnostiquer à partir de radios médicales.
AlexNet — Un réseau de neurones créé en 2012 par des chercheurs de Toronto qui a révolutionné la reconnaissance d'images. Sa victoire écrasante dans un concours international a déclenché le boom du Deep Learning.
L'architecture Transformer, introduite par Google en 2017 dans l'article "Attention Is All You Need", est la fondation de tous les grands modèles de langage actuels (GPT, Claude, Gemini).
Architecture d'un Réseau de Neurones
Couche d'entrée
Données brutes (pixels, tokens…)
Couches cachées
Traitement et représentations abstraites
Couche de sortie
Prédiction ou génération finale
Les 3 Catalyseurs du Deep Learning
Big Data
Milliards de textes et images
GPU / TPU
Puissance de calcul parallèle
Transformers
Architecture de 2017 — base des LLM
4 questions — 70% pour valider ce chapitre