Mémoire persistante pour agents IA : le guide complet 2026
Vos agents IA oublient tout entre les sessions ? Voici pourquoi c'est un problème structurel — et comment le résoudre avec 3 endpoints REST.
Pourquoi les agents IA oublient tout
Un agent IA sans mémoire persistante, c'est comme un collaborateur qui perd tous ses souvenirs chaque nuit. Il peut être brillant pendant la session, mais au prochain appel, il repart de zéro. Il ne sait pas que vous préférez les réponses courtes. Il ne se souvient pas que vous avez déjà rejeté cette option. Il ne connaît pas le contexte du projet sur lequel vous travaillez depuis 6 mois.
Ce problème n'est pas un bug. C'est l'architecture des LLMs : ils ont un contexte de fenêtre fixe (context window) et aucun état entre les appels. Chaque requête commence à zéro.
La solution naïve est d'injecter tout l'historique dans le prompt. Ça fonctionne sur des petits volumes, mais ça explose en coûts et en latence dès que vous avez des utilisateurs réels avec plusieurs semaines d'historique.
La vraie solution : la mémoire persistante vectorielle
La mémoire persistante pour agents IA repose sur trois opérations fondamentales :
- Stocker (remember) : vectoriser le contexte et le sauvegarder dans une base vectorielle
- Rappeler (recall) : recherche sémantique cosinus pour retrouver les souvenirs pertinents
- Injecter (inject-context) : préparer un contexte prêt à être ajouté au prompt suivant
Kronvex expose exactement ces 3 opérations via une API REST. Pas de vector database à déployer, pas de pipeline d'embedding à maintenir.
Comment ça marche concrètement
# 1. Stocker un souvenir après une session
curl -X POST https://api.kronvex.io/api/v1/agents/mon-agent/remember \
-H "X-API-Key: kv-votre-cle" \
-H "Content-Type: application/json" \
-d '{"content": "Utilisateur préfère les réponses concises. Budget projet : 50k€."}'
# 2. Rappeler les souvenirs pertinents
curl -X POST https://api.kronvex.io/api/v1/agents/mon-agent/recall \
-H "X-API-Key: kv-votre-cle" \
-d '{"query": "préférences utilisateur budget"}'
# 3. Injecter le contexte dans le prochain prompt
curl -X POST https://api.kronvex.io/api/v1/agents/mon-agent/inject-context \
-H "X-API-Key: kv-votre-cle" \
-d '{"query": "question actuelle de l utilisateur"}'
Le scoring de confiance : ce qui différencie Kronvex
Kronvex ne retourne pas simplement les vecteurs les plus proches. Chaque souvenir reçoit un score de confiance calculé sur trois dimensions :
- Similarité sémantique (60%) : cosinus similarity pgvector
- Récence (20%) : sigmoid avec inflexion à 30 jours — les souvenirs récents sont favorisés
- Fréquence (20%) : log-scale du nombre d'accès — les souvenirs souvent rappelés sont plus fiables
Le résultat : votre agent rappelle le contexte réellement pertinent, pas juste le plus récent ou le plus similaire textuellement.
TTL decay : les souvenirs qui s'effacent naturellement
Toutes les informations ne doivent pas persister indéfiniment. Kronvex supporte le TTL (Time To Live) sur chaque souvenir. Un souvenir "budget actuel : 50k€" peut expirer après 90 jours si le budget change chaque trimestre. Un souvenir "l'utilisateur est allergique à Python" peut être permanent.
RGPD natif, hébergé en Europe
Toutes les données Kronvex sont hébergées dans l'UE (Supabase Frankfurt). Si votre agent traite des données d'utilisateurs européens, vous êtes conformes RGPD par architecture. Pas de transfert hors UE, pas de DPA compliqué à négocier.
Démarrer en 5 minutes
Créez un compte gratuit sur kronvex.io, obtenez une clé API demo (100 mémoires gratuites), et intégrez les 3 endpoints dans votre agent. Le plan demo suffit pour valider le concept sur votre use case.