Glossaire Intelligence Artificielle

Agent IA

AI Agent

Système d'IA capable de planifier et d'exécuter des actions de façon autonome pour atteindre un objectif. Un agent peut utiliser des outils, naviguer sur le web, écrire du code et s'auto-corriger.

Concept clé

Attention (mécanisme)

Attention Mechanism

Technique fondamentale des transformers permettant au modèle de pondérer l'importance de chaque mot du contexte lors de la génération. C'est la base de tous les LLMs modernes.

API

Application Programming Interface

Interface permettant à un programme d'interagir avec un modèle d'IA. OpenAI, Anthropic, Google et Mistral proposent des APIs pour intégrer leurs modèles dans des applications.

Technique

Fenêtre de contexte

Context Window

Quantité maximale de texte (en tokens) qu'un LLM peut traiter en une seule fois. Plus la fenêtre est grande, plus le modèle peut tenir compte d'une longue conversation ou de longs documents.

Concept clé

Chaîne de pensée

Chain of Thought (CoT)

Technique de prompting qui demande au modèle de raisonner étape par étape avant de donner sa réponse finale. Améliore significativement les performances sur les problèmes complexes.

Constitutional AI

Approche d'entraînement développée par Anthropic pour rendre les modèles d'IA plus sûrs, honnêtes et inoffensifs en leur fournissant un ensemble de principes explicites.

Anthropic

Embedding

Embedding / Vector Embedding

Représentation numérique (vecteur) d'un texte dans un espace mathématique. Les embeddings permettent de mesurer la similarité sémantique entre textes et sont la base des systèmes RAG.

Technique

Fine-tuning

Fine-tuning / Affinage

Processus d'entraînement supplémentaire d'un modèle pré-entraîné sur un jeu de données spécifique pour le spécialiser dans un domaine ou un style particulier.

Entraînement

Function Calling

Function Calling / Tool Use

Capacité d'un LLM à appeler des fonctions ou outils externes (API, base de données, calculatrice) pour obtenir des informations ou effectuer des actions au lieu de tout générer lui-même.

GPT

Generative Pre-trained Transformer

Architecture de réseau de neurones développée par OpenAI, basée sur les transformers. GPT-4 est le modèle sous-jacent de ChatGPT. "Generative" signifie qu'il génère du texte token par token.

OpenAI

Garde-fous

Guardrails

Mécanismes de sécurité intégrés dans un modèle d'IA pour empêcher la génération de contenus dangereux, illégaux ou nuisibles. Chaque éditeur implémente ses propres garde-fous.

Hallucination

Hallucination / Confabulation

Phénomène où un modèle d'IA génère des informations fausses ou inventées avec une apparente confiance. Les LLMs peuvent "halluciner" des citations, des dates ou des faits inexistants.

Concept clé

Inférence

Inference

Phase d'utilisation d'un modèle entraîné pour générer des réponses à partir de nouvelles entrées. Par opposition à l'entraînement, l'inférence est ce qui se passe quand vous envoyez un message à ChatGPT.

Instruction tuning

Instruction Tuning / RLHF

Technique d'entraînement qui affine un modèle pour qu'il suive des instructions humaines. Combiné avec le RLHF (Reinforcement Learning from Human Feedback), il rend les LLMs utiles et sûrs.

LLM

Large Language Model

Grand modèle de langage entraîné sur des milliards de tokens de texte. ChatGPT, Claude, Gemini et Mistral sont des LLMs. Ils génèrent du texte en prédisant le prochain token le plus probable.

Concept clé

Latence

Latency / TTFT

Temps nécessaire pour qu'un modèle commence à générer sa réponse après avoir reçu la requête. Le TTFT (Time To First Token) est une métrique clé pour évaluer la rapidité d'un LLM.

Multimodal

Modèle capable de traiter plusieurs types de données : texte, image, audio, vidéo. Gemini Ultra et GPT-4o sont des modèles multimodaux capables de comprendre et générer des images.

Concept clé

Mixture of Experts

Mixture of Experts (MoE)

Architecture où le modèle est divisé en plusieurs sous-réseaux spécialisés ("experts"). Seule une fraction des experts est activée pour chaque requête, rendant le modèle plus efficace. Mixtral utilise cette approche.

Architecture

NLP

Natural Language Processing

Traitement Automatique du Langage Naturel — branche de l'IA dédiée à la compréhension et la génération du langage humain par les machines. Les LLMs sont la forme la plus avancée du NLP.

Prompt

Instruction ou message envoyé à un modèle d'IA pour obtenir une réponse. La qualité du prompt influence directement la qualité de la réponse — c'est l'objet du prompt engineering.

Concept clé

Prompt Engineering

Art et science de formuler des instructions optimales pour obtenir les meilleures réponses d'un LLM. Inclut des techniques comme le few-shot prompting, la chaîne de pensée et les personas.

Compétence

Paramètres

Parameters / Weights

Valeurs numériques appris durant l'entraînement qui définissent le comportement d'un modèle. GPT-4 aurait environ 1 800 milliards de paramètres. Plus un modèle a de paramètres, plus il est puissant (en général).

RAG

Retrieval-Augmented Generation

Architecture qui connecte un LLM à une base de données externe. Avant de répondre, le système récupère les documents pertinents et les injecte dans le prompt — réduisant les hallucinations sur des données récentes ou privées.

Concept clé

RLHF

Reinforcement Learning from Human Feedback

Technique d'entraînement où des humains évaluent les réponses du modèle, et ces évaluations servent à améliorer ses comportements. Utilisé par OpenAI, Anthropic et Google pour aligner leurs modèles.

Token

Unité de base du texte traitée par un LLM. Un token correspond environ à 4 caractères ou ¾ d'un mot en anglais. "ChatGPT" = 2 tokens. Les LLMs facturent à l'usage en tokens (entrée + sortie).

Concept clé

Température

Temperature

Paramètre qui contrôle l'aléatoire des réponses d'un LLM. Température = 0 → réponses déterministes et prévisibles. Température = 1 → réponses créatives et variées. Essentiel à maîtriser pour l'API.

Transformer

Architecture de réseau de neurones introduite par Google en 2017 ("Attention Is All You Need"). Base de tous les LLMs modernes, elle utilise le mécanisme d'attention pour traiter le texte en parallèle.

Architecture

Base de données vectorielle

Vector Database

Base de données spécialisée dans le stockage et la recherche d'embeddings. Pinecone, Weaviate et pgvector sont des exemples. Indispensable pour construire des applications RAG.

Zero-shot / Few-shot

Zero-shot / Few-shot Prompting

Zero-shot : le modèle répond sans exemple fourni. Few-shot : on lui donne quelques exemples dans le prompt pour guider sa réponse. Le few-shot améliore généralement la précision sur les tâches spécifiques.

Prompting

Prêt à valider tes connaissances en IA ?