Système d'IA capable de planifier et d'exécuter des actions de façon autonome pour atteindre un objectif. Un agent peut utiliser des outils, naviguer sur le web, écrire du code et s'auto-corriger.
Concept clé
Attention (mécanisme)
Attention Mechanism
Technique fondamentale des transformers permettant au modèle de pondérer l'importance de chaque mot du contexte lors de la génération. C'est la base de tous les LLMs modernes.
API
Application Programming Interface
Interface permettant à un programme d'interagir avec un modèle d'IA. OpenAI, Anthropic, Google et Mistral proposent des APIs pour intégrer leurs modèles dans des applications.
Technique
C
Fenêtre de contexte
Context Window
Quantité maximale de texte (en tokens) qu'un LLM peut traiter en une seule fois. Plus la fenêtre est grande, plus le modèle peut tenir compte d'une longue conversation ou de longs documents.
Concept clé
Chaîne de pensée
Chain of Thought (CoT)
Technique de prompting qui demande au modèle de raisonner étape par étape avant de donner sa réponse finale. Améliore significativement les performances sur les problèmes complexes.
Constitutional AI
Constitutional AI
Approche d'entraînement développée par Anthropic pour rendre les modèles d'IA plus sûrs, honnêtes et inoffensifs en leur fournissant un ensemble de principes explicites.
Anthropic
E
Embedding
Embedding / Vector Embedding
Représentation numérique (vecteur) d'un texte dans un espace mathématique. Les embeddings permettent de mesurer la similarité sémantique entre textes et sont la base des systèmes RAG.
Technique
F
Fine-tuning
Fine-tuning / Affinage
Processus d'entraînement supplémentaire d'un modèle pré-entraîné sur un jeu de données spécifique pour le spécialiser dans un domaine ou un style particulier.
Entraînement
Function Calling
Function Calling / Tool Use
Capacité d'un LLM à appeler des fonctions ou outils externes (API, base de données, calculatrice) pour obtenir des informations ou effectuer des actions au lieu de tout générer lui-même.
G
GPT
Generative Pre-trained Transformer
Architecture de réseau de neurones développée par OpenAI, basée sur les transformers. GPT-4 est le modèle sous-jacent de ChatGPT. "Generative" signifie qu'il génère du texte token par token.
OpenAI
Garde-fous
Guardrails
Mécanismes de sécurité intégrés dans un modèle d'IA pour empêcher la génération de contenus dangereux, illégaux ou nuisibles. Chaque éditeur implémente ses propres garde-fous.
H
Hallucination
Hallucination / Confabulation
Phénomène où un modèle d'IA génère des informations fausses ou inventées avec une apparente confiance. Les LLMs peuvent "halluciner" des citations, des dates ou des faits inexistants.
Concept clé
I
Inférence
Inference
Phase d'utilisation d'un modèle entraîné pour générer des réponses à partir de nouvelles entrées. Par opposition à l'entraînement, l'inférence est ce qui se passe quand vous envoyez un message à ChatGPT.
Instruction tuning
Instruction Tuning / RLHF
Technique d'entraînement qui affine un modèle pour qu'il suive des instructions humaines. Combiné avec le RLHF (Reinforcement Learning from Human Feedback), il rend les LLMs utiles et sûrs.
L
LLM
Large Language Model
Grand modèle de langage entraîné sur des milliards de tokens de texte. ChatGPT, Claude, Gemini et Mistral sont des LLMs. Ils génèrent du texte en prédisant le prochain token le plus probable.
Concept clé
Latence
Latency / TTFT
Temps nécessaire pour qu'un modèle commence à générer sa réponse après avoir reçu la requête. Le TTFT (Time To First Token) est une métrique clé pour évaluer la rapidité d'un LLM.
M
Multimodal
Multimodal
Modèle capable de traiter plusieurs types de données : texte, image, audio, vidéo. Gemini Ultra et GPT-4o sont des modèles multimodaux capables de comprendre et générer des images.
Concept clé
Mixture of Experts
Mixture of Experts (MoE)
Architecture où le modèle est divisé en plusieurs sous-réseaux spécialisés ("experts"). Seule une fraction des experts est activée pour chaque requête, rendant le modèle plus efficace. Mixtral utilise cette approche.
Architecture
N
NLP
Natural Language Processing
Traitement Automatique du Langage Naturel — branche de l'IA dédiée à la compréhension et la génération du langage humain par les machines. Les LLMs sont la forme la plus avancée du NLP.
P
Prompt
Prompt
Instruction ou message envoyé à un modèle d'IA pour obtenir une réponse. La qualité du prompt influence directement la qualité de la réponse — c'est l'objet du prompt engineering.
Concept clé
Prompt Engineering
Prompt Engineering
Art et science de formuler des instructions optimales pour obtenir les meilleures réponses d'un LLM. Inclut des techniques comme le few-shot prompting, la chaîne de pensée et les personas.
Compétence
Paramètres
Parameters / Weights
Valeurs numériques appris durant l'entraînement qui définissent le comportement d'un modèle. GPT-4 aurait environ 1 800 milliards de paramètres. Plus un modèle a de paramètres, plus il est puissant (en général).
R
RAG
Retrieval-Augmented Generation
Architecture qui connecte un LLM à une base de données externe. Avant de répondre, le système récupère les documents pertinents et les injecte dans le prompt — réduisant les hallucinations sur des données récentes ou privées.
Concept clé
RLHF
Reinforcement Learning from Human Feedback
Technique d'entraînement où des humains évaluent les réponses du modèle, et ces évaluations servent à améliorer ses comportements. Utilisé par OpenAI, Anthropic et Google pour aligner leurs modèles.
T
Token
Token
Unité de base du texte traitée par un LLM. Un token correspond environ à 4 caractères ou ¾ d'un mot en anglais. "ChatGPT" = 2 tokens. Les LLMs facturent à l'usage en tokens (entrée + sortie).
Concept clé
Température
Temperature
Paramètre qui contrôle l'aléatoire des réponses d'un LLM. Température = 0 → réponses déterministes et prévisibles. Température = 1 → réponses créatives et variées. Essentiel à maîtriser pour l'API.
Transformer
Transformer
Architecture de réseau de neurones introduite par Google en 2017 ("Attention Is All You Need"). Base de tous les LLMs modernes, elle utilise le mécanisme d'attention pour traiter le texte en parallèle.
Architecture
V
Base de données vectorielle
Vector Database
Base de données spécialisée dans le stockage et la recherche d'embeddings. Pinecone, Weaviate et pgvector sont des exemples. Indispensable pour construire des applications RAG.
Z
Zero-shot / Few-shot
Zero-shot / Few-shot Prompting
Zero-shot : le modèle répond sans exemple fourni. Few-shot : on lui donne quelques exemples dans le prompt pour guider sa réponse. Le few-shot améliore généralement la précision sur les tâches spécifiques.
Prompting
Prêt à valider tes connaissances en IA ?
Passe une certification officielle et obtiens un certificat vérifiable — 100% gratuit.