Concepts IA
Agent IA
Autonomous AI Agent
Programme autonome qui raisonne, planifie et agit pour atteindre un objectif.
Un agent IA est un programme autonome capable de percevoir son environnement, de planifier des actions, d'utiliser des outils (APIs, base de données, recherche web) et d'atteindre des objectifs complexes sans intervention humaine à chaque étape. Différent d'un chatbot classique : l'agent prend des décisions, exécute des séquences d'actions, vérifie le résultat et itère si nécessaire.
Exemple concret
Un agent commercial connecté au CRM via MCP qui écoute un appel client, met à jour HubSpot, planifie une relance dans 3 jours et alerte le manager si le deal stagne.
Protocole
MCP
Model Context Protocol
Protocole standardisé qui permet aux LLM de se connecter à n'importe quel outil ou source de données.
Le Model Context Protocol (MCP) est un protocole standardisé open-source créé par Anthropic en 2024. Il permet aux modèles de langage (Claude, GPT, Mistral) de se connecter à des outils, APIs et sources de données externes via une interface unifiée. L'équivalent USB-C pour les agents IA : un seul protocole, tous les outils. MCP remplace les intégrations ad hoc (un connecteur sur mesure pour chaque outil) par un standard unique. Côté concret, on connecte un agent à HubSpot, Notion, votre base SQL ou vos APIs métier en quelques heures au lieu de plusieurs semaines.
Exemple concret
Plutôt que de coder une intégration spécifique pour Salesforce, on installe le serveur MCP officiel Salesforce. Le même agent peut alors aussi parler à Gmail, GitHub, ou votre base PostgreSQL via leurs serveurs MCP respectifs.
Architecture IA
RAG
Retrieval-Augmented Generation
Architecture qui combine recherche sémantique et génération par LLM pour exploiter vos données métier.
L'architecture RAG (Retrieval-Augmented Generation) combine deux briques : un moteur de recherche sémantique (basé sur une base vectorielle) et un modèle de langage (LLM). Vos documents métier sont vectorisés et stockés. À chaque question, les passages les plus pertinents sont récupérés puis fournis au LLM comme contexte. Le LLM génère une réponse précise basée sur vos données, sans avoir besoin de fine-tuning coûteux. C'est l'architecture standard pour les chatbots intelligents, les assistants documentaires et le support client automatisé.
Exemple concret
Un chatbot RAG qui connaît toute votre documentation produit : il vectorise vos PDF, et quand un utilisateur pose une question, il retrouve les paragraphes pertinents et les donne au LLM pour formuler une réponse précise avec les bonnes références.
Modèles IA
LLM
Large Language Model
Modèle d'IA entraîné sur d'énormes volumes de texte, capable de comprendre et générer du langage naturel.
Un LLM (Large Language Model) est un modèle d'intelligence artificielle entraîné sur de très grandes quantités de texte (livres, articles, code, web), capable de comprendre et générer du langage naturel. Les principaux LLM en production en 2026 : GPT-4, GPT-5 (OpenAI, closed-source), Claude (Anthropic, closed-source), Gemini (Google), Mistral (Mistral AI, français, open-source disponible), Llama (Meta, open-source). Un LLM seul ne suffit pas pour exploiter vos données métier : il faut le coupler à un RAG, à des agents IA ou à des connecteurs MCP.
Exemple concret
GPT-4 peut écrire un email, résumer un document, générer du code. Mais sans RAG, il ne connaît pas vos clients, vos produits ou vos process internes.
Service
CTPO as a Service
CTO et Head of Product externalisés
Direction technique (CTO) et produit (Head of Product) externalisée en duo, à la demande.
Le CTPO as a Service est une offre d'accompagnement externalisé qui combine deux rôles habituellement séparés : le CTO (responsable de l'architecture, de la stack et des choix techniques) et le Head of Product (responsable de la stratégie produit, du cadrage, de la roadmap et du go-to-market). Senzu Tech propose cette double compétence en duo via Edouard (CTO, 15+ ans) et Thomas (Head of Product, profil technique passé côté produit), pour les startups et PME qui n'ont ni l'un ni l'autre en interne. Alternative au recrutement d'un CTO et d'un Head of Product senior à temps plein.
Exemple concret
Une startup pré-PMF qui veut lancer sa V1 et préparer sa série A active un CTPO as a Service pour 4 k€/mois pendant 6 mois, le temps de cadrer le produit et structurer l'architecture, sans recruter à 110 k€/an avec equity.
Produit
V1
Première version produit
Premier produit fonctionnel déployé avec de vrais utilisateurs.
La V1 (première version) désigne le premier produit fonctionnel déployé en production et utilisé par de vrais utilisateurs. Elle est distincte du prototype (qui valide une hypothèse technique ou UX) et du MVP (Minimum Viable Product, focalisé sur la valeur minimale). La V1 est un produit complet, en production, avec une architecture scalable. Chez Senzu Tech, une V1 est livrée en 4 à 8 semaines avec une stack moderne (React, Next.js, Node.js, Go).
Exemple concret
Pour une startup SaaS B2B : la V1 est l'application déployée à des clients pilotes payants, avec authentification, facturation, support et features clés. Pas un prototype Figma.
Infrastructure IA
Base vectorielle
Vector database
Base de données spécialisée dans la recherche par similarité sémantique, pas par mots-clés.
Une base vectorielle stocke des données sous forme de vecteurs numériques représentant leur sens. Contrairement à une base SQL classique (recherche par mots-clés exacts), une base vectorielle trouve les données sémantiquement proches d'une requête, même si les mots ne correspondent pas. Indispensable pour le RAG, les moteurs de recherche IA, et les systèmes de recommandation. Principales solutions : Pinecone (cloud), Qdrant (souverain ou cloud), Weaviate, Milvus.
Exemple concret
Un utilisateur cherche "problème de connexion" : la base vectorielle remonte aussi les documents qui parlent de "erreur d'authentification" ou "login impossible", parce qu'ils ont le même sens.
Techniques IA
Fine-tuning
Affinage de modèle
Réentraîner un LLM existant sur vos données spécifiques pour qu'il maîtrise votre domaine.
Le fine-tuning consiste à réentraîner un LLM existant (GPT, Claude, Llama) sur un dataset spécifique à votre domaine pour qu'il apprenne votre vocabulaire, votre style, vos process. Coûteux et long : nécessite un dataset propre, un budget GPU important, et une mise à jour du modèle à chaque évolution. Rarement nécessaire en 2026 : le RAG combiné au prompt engineering couvre 90% des cas d'usage avec un coût et une flexibilité bien meilleurs.
Exemple concret
Fine-tuner Llama-3 sur 100 000 contrats juridiques pour qu'il génère des clauses dans votre style. Alternative recommandée : RAG sur les mêmes 100 000 contrats, infiniment plus rapide à mettre en place.
Architecture
Cloud-Native
Architecture cloud-native
Architecture pensée pour scaler horizontalement sur le cloud, dès le premier jour.
Une architecture cloud-native est conçue pour exploiter pleinement les services cloud : containerisation (Docker), orchestration (Kubernetes ou alternatives plus légères comme CapRover), services managés (bases de données, queues, stockage), scalabilité horizontale automatique, déploiements continus. Permet de passer de 100 à 1 million d'utilisateurs sans refonte d'architecture. Standard chez Senzu Tech sur tout projet V1 ou agent IA en production.
Exemple concret
Une V1 cloud-native peut tourner sur un serveur à 20 €/mois et passer automatiquement à 30 instances réparties dans 3 régions si le trafic explose, sans intervention humaine.
Produit
Discovery (produit)
Discovery utilisateur
Phase d'investigation pour comprendre le problème avant de coder la solution.
La discovery produit est la phase d'investigation où on comprend en profondeur le problème, les utilisateurs, les contraintes business et techniques, avant de commencer à coder. Elle évite de bâtir le mauvais produit. Inclut : entretiens utilisateurs, ateliers métier, analyse concurrentielle, prototypes papier, tests d'hypothèses. Chez Senzu Tech, la phase discovery dure 1 à 2 semaines et débouche sur un cahier des charges, une architecture proposée et un planning chiffré.
Exemple concret
Avant de développer un agent IA pour le service commercial, on passe 3 jours en immersion : on observe les commerciaux, on identifie les vraies tâches qui consomment du temps, on quantifie le ROI potentiel.
Conformité
IA souveraine
Sovereign AI
IA déployée sur infrastructure française ou européenne, sans sortie de données vers les US.
L'IA souveraine désigne un déploiement d'intelligence artificielle où l'ensemble de la chaîne (modèles, infrastructure, données) reste en France ou dans l'Union européenne. Important pour les secteurs réglementés (santé, juridique, finance, secteur public) et la conformité RGPD. Implique l'usage de LLM open-source (Mistral, Llama) hébergés sur OVH, Scaleway ou infrastructure interne, plutôt que d'API US (OpenAI, Anthropic). Senzu Tech propose ce mode de déploiement systématiquement pour les données sensibles.
Exemple concret
Un cabinet d'avocats déploie un agent IA pour résumer ses dossiers : modèle Mistral sur GPU OVH à Roubaix, base vectorielle Qdrant en France, aucune donnée envoyée à OpenAI. Conformité RGPD totale.
Comparatifs
MCP vs RAG
Différence entre MCP et RAG
MCP donne aux agents IA l'accès aux outils. RAG leur donne l'accès aux données. Souvent combinés.
MCP et RAG ne sont pas en concurrence, ils résolvent deux problèmes différents et sont souvent combinés. RAG permet à un LLM de répondre à des questions en cherchant dans une base de connaissances vectorielle (récupération d'information). MCP permet à un agent IA d'utiliser des outils externes (APIs, bases de données, applications) de manière standardisée (action). Un agent IA moderne utilise typiquement les deux : MCP pour interagir avec les outils + RAG pour exploiter la documentation métier.
Exemple concret
Un agent support client : RAG pour chercher dans la doc produit (lecture), MCP pour ouvrir un ticket Zendesk, mettre à jour le CRM, planifier un rappel (action).