16 juin 2026
Temps de lecture : 3 min
Avec l’émergence des agents IA capables de réaliser des tâches complexes en autonomie, la consommation de tokens explose.
Dans l’univers de l’IA générative, le token désigne l’unité de base avec laquelle une machine traite le langage. On l’associe souvent au texte, car il correspond à un fragment de mot, une syllabe ou un signe de ponctuation. Mais avec l’essor des modèles multimodaux, le token va bien au-delà : il peut tout à fait représenter un fragment d’image ou de vidéo. L’IA découpe l’image ou le texte en tokens que la machine peut traiter mathématiquement.
Initialement, l’utilisation de l’IA générative reposait sur des moteurs d’IA, comme ChatGPT, accessibles via des abonnements fixes couvrant largement les besoins conversationnels de base. Mais l’augmentation fulgurante de la mémoire des modèles (passée de 100 000 à 4 millions de tokens par contexte) et l’arrivée des agents IA ont radicalement changé la donne.
Comme l’explique Francis Lelong, CEO d’Alegria.group et cofondateur de Sarenza, la bascule vers les agents autonomes marque une nouvelle étape : nous ne sommes plus dans une simple logique de question-réponse, mais dans la délégation de tâches complètes à des intelligences artificielles qui travaillent pour nous, ce qui multiplie mécaniquement la consommation de tokens. L’IA ne se contente plus de répondre, elle agit, orchestre et crée du contenu multimédia (texte, image, vidéo) en sollicitant l’API en temps réel.
Face aux factures qui s’envolent, de nombreux comités de direction s’inquiètent de ces nouveaux coûts. Pourtant, évaluer l’IA sous le seul prisme de la dépense logicielle est une erreur, selon Francis Lelong. Comme une machine industrielle, la valeur de l’IA ne se mesure pas à sa consommation d’énergie, mais à l’augmentation de la capacité de production qu’elle génère.
« Il faut s’attendre à consommer entre 1 000 et 2 000 euros de tokens par mois et par collaborateur. Ce n’est pas un problème tant que le retour sur investissement est là. Pour ma part, grâce à ce budget, j’estime avoir l’équivalent de cinq collaborateurs virtuels qui travaillent à mes côtés toute la journée sans que j’aie de salaires supplémentaires à verser », développe-t-il.
Il ajoute d’ailleurs que pour qu’un futur talent soit véritablement « augmenté », son package d’embauche devra inclure ce budget technologique : « Quand on recrute aujourd’hui, en plus du salaire et de l’ordinateur, il faut lui payer des tokens ».
Le CEO d’Alegria est conscient néanmoins que l’heure est à la sobriété technologique. Que ce soit pour la bonne cause, c’est-à-dire l’urgence environnementale, ou bien par simple contrainte financière, « nous allons obligatoirement devoir apprendre à gérer nos tokens de manière beaucoup plus frugale et efficace », selon lui.
Francis Lelong anticipe l’apparition d’un nouveau profil, le « token manager », dont le rôle sera d’optimiser les coûts en jonglant intelligemment entre les outils : par exemple, en réservant les coûteux modèles « frontières » (les modèles payants les plus avancés) pour la phase de conception complexe, tout en s’appuyant sur des modèles open-source bien moins chers pour l’exécution quotidienne.
Dans le futur, la question ne sera pas de savoir s’il faut ou non faire appel à l’IA pour une tâche donnée. « Aujourd’hui, on ne se pose plus la question s’il vaut mieux envoyer un courrier ou un e-mail », illustre-t-il.
Contrairement à ce que l’on pourrait penser, l’utilisateur final n’aura pas à arbitrer manuellement ses usages. Le CEO d’Alegria.group estime que des routeurs intelligents choisiront automatiquement l’IA la plus adaptée à la complexité de la tâche.
Le véritable défi résidera dans la redéfinition des rôles au sein de l’entreprise. Cela nous conduira inévitablement vers une « tokénisation » des fiches de poste, conclut Francis Lelong : le budget de tokens alloué différera drastiquement selon que l’on soit développeur, comptable ou marketeur. Ces choix détermineront si les outils rendent les employés plus performants dans leur cœur d’expertise ou simplement plus paresseux.
Topics
TOUS LES MATINS, RECEVEZ UNE DOSE D'ADTECH, D'EVENEMENTS, D'INNOVATIONS, MEDIA, MARKETING...
Je découvre les newsletters Minted !