LangGraph MÃ©moire PersistanteÂ : Ã‰tat Survivant Entre les ExÃ©cutions (2026) â€” Kronvex

Le problÃ¨me de mÃ©moire LangGraph

LangGraph est livrÃ© avec un checkpointer intÃ©grÃ© appelÃ© MemorySaver. Il stocke l'Ã©tat du graphe pour que l'exÃ©cution puisse Ãªtre reprise en cours de route. C'est utile pour les agents multi-Ã©tapes avec boucles humaines.

Mais il y a une limitation fondamentale qui piÃ¨ge presque toutes les Ã©quipes qui construisent des agents en production avec LangGraph : MemorySaver stocke l'Ã©tat en mÃ©moire process. DÃ¨s que votre processus Python redÃ©marre â€” un nouveau dÃ©ploiement, un Ã©vÃ©nement de scaling â€” chaque checkpoint stockÃ© est perdu.

La documentation LangGraph est claire Ã ce sujet, mais c'est facile Ã manquer. L'avertissement pertinent dit : "MemorySaver is an in-memory checkpointer. This means it will be lost when the process restarts. It is not suitable for production use."

L'Ã©tendue du problÃ¨me : MemorySaver ne persiste l'Ã©tat que dans un seul thread ID. MÃªme si votre processus ne redÃ©marre jamais, deux conversations sÃ©parÃ©es avec le mÃªme utilisateur â€” chacune utilisant un thread ID diffÃ©rent â€” ne peuvent pas partager la mÃ©moire.

Cela affecte deux cas d'usage distincts souvent confondus. Le premier est le checkpointing : sauvegarder l'Ã©tat d'exÃ©cution exact d'un graphe en cours. Le second est la mÃ©moire Ã long terme : stocker des faits sÃ©mantiques sur un utilisateur pour que les conversations futures bÃ©nÃ©ficient des interactions passÃ©es.

Ce que "persistant" veut vraiment dire dans LangGraph

Quand les dÃ©veloppeurs parlent de "mÃ©moire persistante dans LangGraph", ils veulent gÃ©nÃ©ralement dire l'une de deux choses.

La persistance au niveau du thread signifie que l'Ã©tat du graphe est durable dans un seul fil de conversation. Les checkpointers SqliteSaver et PostgresSaver de LangGraph fournissent cela.

La mÃ©moire cross-session est diffÃ©rente. Elle signifie que l'agent peut rappeler des faits de conversations prÃ©cÃ©dentes qui se sont dÃ©roulÃ©es dans diffÃ©rents thread IDs. "Cet utilisateur m'a dit qu'il prÃ©fÃ¨re des rÃ©ponses concises." Rien de tout cela ne rentre dans un checkpoint de graphe.

Le modÃ¨le deux couches : Les agents LangGraph en production ont gÃ©nÃ©ralement besoin des deux couches. Utilisez PostgresSaver pour la persistance des checkpoints, et un store de mÃ©moire externe comme Kronvex pour la mÃ©moire sÃ©mantique cross-session.

La partie dÃ©routante est que la doc LangGraph parle des deux sous le terme "mÃ©moire", mais ils servent des objectifs complÃ¨tement diffÃ©rents. Un checkpoint de graphe est un snapshot binaire d'objets Python. Un store de mÃ©moire sÃ©mantique est une base vectorielle interrogeable.

La solution : store de mÃ©moire externe avec Kronvex

Kronvex est une API mÃ©moire persistante pour agents IA. Elle expose trois endpoints qui s'alignent proprement sur le cycle de vie de la mÃ©moire :

/remember â€” stocke un fait textuel avec un tag de type optionnel. Kronvex l'embarque avec text-embedding-3-small et le persiste dans PostgreSQL + pgvector en UE.
/recall â€” rÃ©cupÃ¨re les top-k mÃ©moires les plus pertinentes pour une requÃªte par similaritÃ© cosinus, scorÃ©es par similaritÃ© × 0,6 + rÃ©cence × 0,2 + frÃ©quence × 0,2.
/inject-context â€” rÃ©cupÃ¨re les mÃ©moires prÃ©-formatÃ©es comme bloc contexte prÃªt Ã Ãªtre insÃ©rÃ© dans un prompt systÃ¨me. GÃ¨re la dÃ©duplication et le filtrage de pertinence automatiquement.

Chaque agent de votre systÃ¨me obtient son propre espace mÃ©moire isolÃ©, identifiÃ© par un UUID que vous assignez. Pour un SaaS multi-tenant, chacun de vos utilisateurs finaux devient un agent Kronvex sÃ©parÃ©.

Le point d'intÃ©gration dans un graphe LangGraph est un nÅ“ud. Vous ajoutez un memory_node qui se dÃ©clenche avant l'appel LLM principal. Il interroge Kronvex pour des mÃ©moires pertinentes basÃ©es sur le dernier message de l'utilisateur, puis injecte les rÃ©sultats dans l'Ã©tat comme contexte.

INSTALL

pip install kronvex
# async: pip install "kronvex[async]"

Code : agent LangGraph avec mÃ©moire Kronvex

Avant : LangGraph avec MemorySaver (mÃ©moire perdue au redÃ©marrage)

Le quickstart standard LangGraph utilise MemorySaver comme checkpointer. L'Ã©tat persiste dans un thread, mais disparaÃ®t avec le processus. Il est impossible de rappeler ce qui s'est passÃ© en session 1 pendant la session 2.

Python — Standard LangGraph (in-memory, non-persistent)

from langgraph.graph import StateGraph, END
from langgraph.checkpoint.memory import MemorySaver
from typing import TypedDict, Annotated
from langchain_openai import ChatOpenAI
import operator

class AgentState(TypedDict):
    messages: Annotated[list, operator.add]

llm = ChatOpenAI(model="gpt-4o-mini")

def call_model(state: AgentState):
    response = llm.invoke(state["messages"])
    return {"messages": [response]}

# Build graph
builder = StateGraph(AgentState)
builder.add_node("agent", call_model)
builder.set_entry_point("agent")
builder.add_edge("agent", END)

# MemorySaver: thread-level, in-process only
# All checkpoints vanish on process restart
memory = MemorySaver()
graph = builder.compile(checkpointer=memory)

# Session 1
config = {"configurable": {"thread_id": "user-001-session-1"}}
graph.invoke({"messages": [{"role": "user", "content": "I prefer Python over TypeScript"}]}, config)

# Session 2 â€” new thread ID, different process restart
# Agent has NO memory of session 1
config2 = {"configurable": {"thread_id": "user-001-session-2"}}
result = graph.invoke({"messages": [{"role": "user", "content": "What language should I use?"}]}, config2)
# Agent cannot recall the Python preference from session 1

AprÃ¨s : LangGraph + Kronvex (mÃ©moire persistante cross-session)

Le pattern est simple : ajoutez deux nÅ“uds Ã votre graphe. Un memory_recall_node se dÃ©clenche avant l'appel LLM pour injecter le contexte pertinent. Un memory_store_node se dÃ©clenche aprÃ¨s pour persister les nouveaux faits.

Python — LangGraph + Kronvex persistent memory

from langgraph.graph import StateGraph, END
from langgraph.checkpoint.memory import MemorySaver
from typing import TypedDict, Annotated, Optional
from langchain_openai import ChatOpenAI
import operator
import httpx

KRONVEX_API_KEY = "kv-your-key"
KRONVEX_AGENT_ID = "your-agent-id"

class AgentState(TypedDict):
    messages: Annotated[list, operator.add]
    memory_context: Optional[str]

llm = ChatOpenAI(model="gpt-4o-mini")

# â”€â”€ Kronvex helpers â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€

def remember(content: str, memory_type: str = "fact"):
    httpx.post(
        f"https://api.kronvex.io/api/v1/agents/{KRONVEX_AGENT_ID}/remember",
        headers={"X-API-Key": KRONVEX_API_KEY},
        json={"content": content, "memory_type": memory_type}
    )

def recall(query: str, top_k: int = 5):
    r = httpx.post(
        f"https://api.kronvex.io/api/v1/agents/{KRONVEX_AGENT_ID}/recall",
        headers={"X-API-Key": KRONVEX_API_KEY},
        json={"query": query, "top_k": top_k, "threshold": 0.5}
    )
    return r.json()["results"]

# â”€â”€ Graph nodes â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€

def memory_recall_node(state: AgentState):
    """Recall relevant memories before the LLM responds."""
    latest_message = state["messages"][-1]["content"]
    memories = recall(latest_message)
    if memories:
        context = "\n".join(f"- {m['memory']['content']}" for m in memories)
        return {"memory_context": f"Relevant context from past sessions:\n{context}"}
    return {"memory_context": None}

def call_model(state: AgentState):
    """Call the LLM, injecting memory context into the system prompt."""
    messages = state["messages"].copy()
    if state.get("memory_context"):
        system = {
            "role": "system",
            "content": f"You are a helpful assistant.\n\n{state['memory_context']}"
        }
        messages = [system] + messages
    response = llm.invoke(messages)
    return {"messages": [response]}

def memory_store_node(state: AgentState):
    """Extract and store new facts from the assistant's last response."""
    last_response = state["messages"][-1].content
    # In production: use an LLM to extract structured facts before storing.
    # Here we store the full response as context (simplified example).
    remember(f"Assistant said: {last_response[:500]}", memory_type="event")
    return {}

# â”€â”€ Build graph â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€

builder = StateGraph(AgentState)
builder.add_node("recall", memory_recall_node)
builder.add_node("agent", call_model)
builder.add_node("store", memory_store_node)

builder.set_entry_point("recall")
builder.add_edge("recall", "agent")
builder.add_edge("agent", "store")
builder.add_edge("store", END)

graph = builder.compile(checkpointer=MemorySaver())

# Session 1
config = {"configurable": {"thread_id": "user-001-session-1"}}
graph.invoke({
    "messages": [{"role": "user", "content": "I prefer Python over TypeScript for all my projects"}],
    "memory_context": None
}, config)

# Session 2 â€” different thread, different process, different day
# Kronvex recalls the Python preference automatically
config2 = {"configurable": {"thread_id": "user-001-session-2"}}
result = graph.invoke({
    "messages": [{"role": "user", "content": "What language should I use for the new microservice?"}],
    "memory_context": None
}, config2)
# Agent now answers: "Based on your past preference for Python..."

Note de production : Dans le memory_store_node, remplacez l'approche simplifiÃ©e "stocker tout" par une Ã©tape d'extraction LLM. Promptez un modÃ¨le rapide (gpt-4o-mini) avec le tour de conversation et demandez-lui d'extraire des faits discrets Ã retenir. Stockez chaque fait comme une mÃ©moire sÃ©parÃ©e.

AvancÃ© : inject_context pour le rappel automatique

L'endpoint /recall renvoie des objets mÃ©moire structurÃ©s avec des scores de confiance. Pour de nombreux cas d'usage, vous voulez une interface plus simple : donnez-moi un bloc contexte formatÃ© que je peux insÃ©rer directement dans un prompt systÃ¨me.

L'endpoint /inject-context de Kronvex fait exactement cela. Vous passez une chaÃ®ne de requÃªte et un budget de caractÃ¨res maximum, et il renvoie une chaÃ®ne de contexte prÃªte Ã l'emploi.

Python — Using inject_context in a LangGraph node

import httpx

KRONVEX_API_KEY = "kv-your-key"
KRONVEX_AGENT_ID = "your-agent-id"

def inject_context(query: str, max_tokens: int = 800) -> str:
    """Return a formatted memory block ready for a system prompt."""
    r = httpx.post(
        f"https://api.kronvex.io/api/v1/agents/{KRONVEX_AGENT_ID}/inject-context",
        headers={"X-API-Key": KRONVEX_API_KEY},
        json={"query": query, "max_tokens": max_tokens, "threshold": 0.45}
    )
    data = r.json()
    return data.get("context", "")  # Returns "" if no relevant memories

def memory_recall_node(state: AgentState):
    """Use inject_context to get a fully formatted memory block."""
    latest_message = state["messages"][-1]["content"]
    context = inject_context(latest_message)
    return {"memory_context": context if context else None}

def call_model(state: AgentState):
    """System prompt now includes pre-formatted memory context."""
    messages = list(state["messages"])
    system_content = "You are a helpful assistant."
    if state.get("memory_context"):
        system_content += f"\n\n## Long-term memory\n{state['memory_context']}"
    messages = [{"role": "system", "content": system_content}] + messages
    response = llm.invoke(messages)
    return {"messages": [response]}

L'endpoint inject_context gÃ¨re la dÃ©duplication qui causerait autrement des problÃ¨mes quand plusieurs mÃ©moires liÃ©es remontent pour la mÃªme requÃªte.

Diagramme d'architecture

  User message
       â”‚
       â–¼
  â”Œâ”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”
  â”‚             LangGraph Graph                    â”‚
  â”‚                                                â”‚
  â”‚  â”Œâ”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”                          â”‚
  â”‚  â”‚  memory_recall   â”‚ â—„â”€â”€ Kronvex /recall      â”‚
  â”‚  â”‚  node            â”‚     (semantic search,    â”‚
  â”‚  â”‚                  â”‚      cross-session)      â”‚
  â”‚  â””â”€â”€â”€â”€â”€â”€â”€â”€â”¬â”€â”€â”€â”€â”€â”€â”€â”€â”€â”˜                          â”‚
  â”‚           â”‚ injects context into state         â”‚
  â”‚           â–¼                                    â”‚
  â”‚  â”Œâ”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”                          â”‚
  â”‚  â”‚   agent node     â”‚ â—„â”€â”€ LLM (GPT-4o, etc.)  â”‚
  â”‚  â”‚   (LLM call)     â”‚     system prompt =      â”‚
  â”‚  â”‚                  â”‚     base + memories      â”‚
  â”‚  â””â”€â”€â”€â”€â”€â”€â”€â”€â”¬â”€â”€â”€â”€â”€â”€â”€â”€â”€â”˜                          â”‚
  â”‚           â”‚                                    â”‚
  â”‚           â–¼                                    â”‚
  â”‚  â”Œâ”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”                          â”‚
  â”‚  â”‚  memory_store    â”‚ â”€â”€â–º Kronvex /remember    â”‚
  â”‚  â”‚  node            â”‚     (persist new facts)  â”‚
  â”‚  â””â”€â”€â”€â”€â”€â”€â”€â”€â”¬â”€â”€â”€â”€â”€â”€â”€â”€â”€â”˜                          â”‚
  â”‚           â”‚                                    â”‚
  â”‚  â”Œâ”€â”€â”€â”€â”€â”€â”€â”€â–¼â”€â”€â”€â”€â”€â”€â”€â”€â”€â”                          â”‚
  â”‚  â”‚  PostgresSaver   â”‚  â† Thread-level state    â”‚
  â”‚  â”‚  checkpointer    â”‚    (resume on restart)   â”‚
  â”‚  â””â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”˜                          â”‚
  â””â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”˜
       â”‚
       â–¼
  Response to user

  â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€
  Kronvex (EU, pgvector)   PostgresSaver (your DB)
  Cross-session facts      Graph execution state
  Semantic search          Exact checkpoint replay

L'insight clÃ© est que ces deux couches de persistance sont orthogonales. PostgresSaver gÃ¨re la question : "oÃ¹ en Ã©tais-je dans cette exÃ©cution ?" Kronvex gÃ¨re la question : "que sais-je sur cet utilisateur ou ce domaine ?"

Comparaison : MemorySaver vs SqliteSaver vs Kronvex

FonctionnalitÃ©	MemorySaver	SqliteSaver	Kronvex
Survit au redÃ©marrage du processus	✗	✓	✓
MÃ©moire cross-thread	✗	✗	✓
Recherche par similaritÃ© sÃ©mantique	✗	✗	✓
Aucune infrastructure Ã gÃ©rer	✓	Local file only	✓ Hosted API
Isolation multi-tenant	✗	Manual	✓ Agent ID scoped
RÃ©sidence des donnÃ©es UE (RGPD)	Wherever deployed	Wherever deployed	✓ Frankfurt, EU
Score de confiance	✗	✗	✓ Similarity + recency + frequency
Cas d'usage	Dev / prototyping	Single-machine apps	Production agents, B2B SaaS
Niveau gratuit	✓	✓	✓ 1 agent, 100 memories

Stack recommandÃ© : Utilisez MemorySaver en dÃ©veloppement local, passez Ã PostgresSaver pour la persistance des checkpoints en production, et ajoutez Kronvex pour la mÃ©moire sÃ©mantique cross-session.

FAQ

Kronvex remplace-t-il le checkpointer de LangGraph ?

Non. Ils rÃ©solvent des problÃ¨mes diffÃ©rents. Un checkpointer LangGraph sauvegarde l'Ã©tat d'exÃ©cution du graphe. Kronvex stocke des mÃ©moires sÃ©mantiques : faits, prÃ©fÃ©rences et Ã©vÃ©nements Ã rappeler dans de futures conversations. Vous utilisez les deux ensemble.

Quel est l'overhead de latence de l'ajout d'un nÅ“ud de rappel Kronvex ?

Un appel /recall typique se termine en 40â€“80ms (p50). C'est acceptable car l'appel LLM lui-mÃªme (la latence dominante) prend typiquement 500msâ€“3s.

Assignez un ID agent Kronvex par utilisateur final. Chaque agent Kronvex a un store mÃ©moire complÃ¨tement isolÃ© â€” /recall sur l'agent ID A ne renvoie jamais de mÃ©moires de l'agent ID B.

Oui. Remplacez les appels httpx.post par await httpx.AsyncClient().post(...). LangGraph supporte nativement les fonctions de nÅ“uds async. DÃ©finissez vos nÅ“uds mÃ©moire comme async def et utilisez await pour les appels API Kronvex.

LangGraph et la mÃ©moire persistante : un Ã©tat qui survit entre les exÃ©cutions (2026)

Sommaire