1,04 milliard de tokens plus tard.
400 000 documents par agent : le vrai travail invisible.
Il y a un moment délicat dans la construction d’un système.
Celui où l’on sait que quelque chose va s’ouvrir…
mais où il serait irresponsable de le faire trop tôt.
C’est exactement là que nous sommes.
Chez Youpi, un agent n’est pas un gadget.
Ce n’est pas une “IA qui répond”.
C’est une capacité de jugement contextualisée.
Or, cette capacité repose presque entièrement sur une chose :
la qualité de ce qu’il sait mobiliser, pas seulement de ce qu’il sait générer.
C’est pour cette raison que nous avons fait un choix clair :
mettre à jour en profondeur nos RAG avant toute ouverture massive des talents.
Pour garantir de la justesse.
Ce que changent les RAG de nouvelle génération
Un RAG n’est pas une bibliothèque.
C’est une manière d’organiser la mémoire.
Les RAG que nous déployons actuellement permettent :
une compréhension plus fine des contextes métier,
une capacité à relier des sources hétérogènes sans les aplatir,
une hiérarchisation réelle de l’information, plutôt qu’un empilement.
Concrètement, cela signifie qu’un agent ne “sait pas plus de choses”.
Il sait mieux lesquelles mobiliser, et quand.
C’est une différence invisible à l’interface.
Mais décisive dans l’usage.
Enrichir la connaissance, pas seulement les modèles
En parallèle, nous travaillons sur un chantier plus lent, mais fondamental :
l’enrichissement des connaissances métiers.
Pas avec des données génériques.
Mais avec :
des experts de terrain,
des exemples réels,
des études de cas documentées,
des décisions expliquées, pas seulement des résultats.
Chaque agent intègre plus de 400 000 documents longs bruts.
Cela représente entre 1,04 et 1,22 milliard de tokens réellement traités par agent.
Ces tokens correspondent à de l’analyse, de la structuration et de l’enrichissement, pas à de la génération de réponses.
Les 15 agents travaillent en parallèle.
Ce n’est pas instantané.
C’est un travail de fond.
À ce rythme volontairement qualitatif, le traitement complet, pour l’ensemble des agents, prend environ 17,5 jours.
Ce que cela implique pour l’ouverture des talents
Nous n’allons pas attendre que tout soit terminé pour avancer.
Mais nous n’ouvrirons pas non plus “en bloc”.
Les talents seront ouverts progressivement,
au fur et à mesure de l’avancement réel du traitement des tokens.
C’est plus lent.
Mais c’est lisible.
Et surtout, c’est cohérent avec ce que nous cherchons à construire :
des agents utiles dans la durée,
pas impressionnants pendant une semaine.
Il reste donc un peu de patience à avoir.
Pas longtemps.
Mais suffisamment pour que ce qui arrive tienne réellement debout.
Parfois, le bon choix n’est pas d’ouvrir plus vite.
C’est d’ouvrir au bon moment.
Avec .love



1 milliard de tokens “traités” pour faire du fond plutôt que des démos, c’est un message clair : la qualité coûte du temps et de la discipline.
Cela remet aussi en cause le mythe : “plus de prompts” ne compense pas une mémoire mal organisée.
Si on veut des agents utiles, il faut parler scoring de sources, traçabilité, et arbitrages métier, pas seulement vitesse de réponse. Je les attends avec impatience 😉