Comparaison · Base vectorielle vs API Mémoire
Pinecone vs Kronvex
Base vectorielle vs API Mémoire
Pinecone est une base de données vectorielle généraliste — elle stocke des vecteurs, vous construisez le reste. Kronvex est une API mémoire dédiée aux agents IA avec scoring de confiance intégré.
TL;DR
Côte à côte en 30 secondes
| Fonctionnalité | Pinecone | Kronvex |
|---|---|---|
| Objectif | Base de données vectorielle généraliste | API mémoire dédiée aux agents IA |
| Mise en place jusqu'à la première mémoire | 30+ min (embed → upsert → query → format) | 5 min (POST /remember) |
| Score de confiance | ✗ | ✓ |
| Pondération par récence | ✗ | ✓ |
| Endpoint inject-context | ✗ | ✓ |
| Modèle agent / session | ✗ | ✓ |
| RGPD / Hébergement UE | ✗ | ✓ |
| Modèle tarifaire | Par unité d'écriture + stockage + lectures | Mensuel forfaitaire (29 €/mois Builder) |
| Offre gratuite | Serverless gratuit (région US) | ✓ 100 mémoires |
| SDK Python & Node | ✓ | ✓ |
Données exactes en mars 2026. Sources : pinecone.io, kronvex.io/docs.
Comparaison honnête
Lequel utiliser ?
Vous avez besoin d'infrastructure vectorielle brute
- Vous construisez un moteur de recherche sémantique (produits, documents, médias)
- Vous faites des systèmes de recommandation où vous gérez toute la logique de classement
- Vous faites de la recherche de similarité à très grande échelle (milliards de vecteurs)
- Vous embedez des objets arbitraires (images, audio, données structurées)
- Vous voulez un contrôle total sur les namespaces, le filtrage de métadonnées et le tuning d'index
- La mémoire n'est pas votre cas d'usage — vous faites du RAG sur des documents
Vous construisez de la mémoire agent
- Votre agent IA doit se souvenir des interactions passées entre les sessions
- Vous voulez que la récence et la fréquence influencent les mémoires qui remontent
- Vous avez besoin d'inject-context pour construire le prompt système automatiquement
- Vous servez des utilisateurs UE et la conformité RGPD est non négociable
- Vous voulez un coût mensuel forfaitaire et prévisible plutôt qu'une facturation par opération
- Vous avez besoin d'isolation multi-tenant où chaque agent client est séparé
Comparaison de code
La même tâche, deux approches
Objectif : quand un agent démarre une conversation, injecter les 5 mémoires les plus pertinentes dans le prompt système. Voici la quantité de code nécessaire pour chaque approche.
PINECONE — build it yourselfimport openai from pinecone import Pinecone from datetime import datetime import math pc = Pinecone(api_key="pc-...") index = pc.Index("agent-memories") oai = openai.OpenAI() def get_embedding(text): r = oai.embeddings.create( model="text-embedding-3-small", input=text ) return r.data[0].embedding def remember(agent_id, text): vec = get_embedding(text) index.upsert(vectors=[{ "id": f"{agent_id}_{hash(text)}", "values": vec, "metadata": { "text": text, "agent_id": agent_id, "ts": datetime.utcnow().isoformat(), "access_count": 0 } }], namespace=agent_id) def inject_context(agent_id, query, n=5): vec = get_embedding(query) results = index.query( vector=vec, top_k=20, namespace=agent_id, include_metadata=True ) # Manual confidence scoring: you build this now = datetime.utcnow() scored = [] for m in results.matches: sim = m.score ts = datetime.fromisoformat(m.metadata["ts"]) age_days = (now - ts).days recency = 1 / (1 + math.exp(-(age_days - 30) / 5)) freq = math.log1p(m.metadata.get("access_count", 0)) score = sim*0.6 + recency*0.2 + freq*0.2 scored.append((score, m.metadata["text"])) scored.sort(reverse=True) top = [t for _, t in scored[:n]] # Format as prompt block — also your job return "Memory context:\n" + "\n".join( f"- {t}" for t in top ) # ~50 lines of boilerplate, just for basic memory
KRONVEX — already done for youfrom kronvex import Kronvex client = Kronvex(api_key="kv-...") agent = client.agent("user-123") # Store a memory (embedding done server-side) await agent.remember( "User prefers Python over JavaScript" ) # Get ranked context, formatted for your prompt context = await agent.inject_context( "What language does this user prefer?" ) # Returns ready-to-use prompt block: # "Memory context: # - User prefers Python over JavaScript (confidence: 0.94) # - User dislikes boilerplate code (confidence: 0.71) # ..." # Confidence scoring is automatic: # similarity×0.6 + recency×0.2 + frequency×0.2 # EU-hosted, GDPR-native, no infra to manage. # 7 lines. That's it.
Ce que Kronvex ajoute aux vecteurs bruts
Mémoire ≠ Stockage vectoriel
Score de confiance
La similarité cosinus brute ignore le temps. Une mémoire de 6 mois est classée pareil qu'une d'hier. Kronvex pondère par récence et fréquence — les mémoires pertinentes récentes remontent naturellement.
similarity · recency · frequencyinject-context
Les bases vectorielles retournent des correspondances. Vous devez encore les classer, les formater et les injecter. inject-context fait tout en un seul appel.
one API call → ready promptNatif UE par conception
Pinecone est hébergé aux US. Si vos utilisateurs sont en Europe, chaque mémoire traverse l'Atlantique. Kronvex stocke tout dans Supabase Francfort — RGPD inclus.
Frankfurt · GDPR · right to erasureQuestions
Questions fréquentes
text-embedding-3-small et un index HNSW pour un rappel sous 40ms.inject-context récupère les N mémoires les plus pertinentes et les retourne formatées comme un bloc de prompt système prêt à insérer — économisant le code de plomberie.DELETE /api/v1/agents/{id}/memories/{id}.Commencez avec une clé démo gratuite
Hébergé en UE. Sans carte bancaire. Votre première mémoire en moins de 5 minutes.
Obtenir votre clé démo →Clé démo · 1 agent · 100 mémoires · Sans expiration