
Imaginez pouvoir dire à une IA : “Retouche cette photo dans GIMP”, “Fais un rendu 3D dans Blender”, ou “Convertis ce document LibreOffice en PDF”… et qu’elle le fasse réellement, en pilotant le logiciel comme un expert. C’est exactement ce que propose CLI-Anything, un projet open source de l’Université de Hong Kong qui a déjà conquis plus de 26 000 étoiles sur GitHub en moins d’un mois.
Accéder au projet CLI-Anything sur GitHub
Le problème : les logiciels parlent aux humains, pas aux IA
Aujourd’hui, les agents IA (Claude Code, Cursor, Copilot…) sont redoutablement efficaces pour écrire du code et manipuler des fichiers texte. Mais dès qu’il s’agit de piloter un vrai logiciel — un éditeur d’image, un modeleur 3D, un tableur — ils sont bloqués. Ces logiciels ont des interfaces graphiques conçues pour les humains, pas pour les machines.
CLI-Anything résout ce problème avec une approche élégante : générer automatiquement une interface en ligne de commande (CLI) pour n’importe quel logiciel, à partir de son code source.
Comment ça marche ?
Le principe est en 7 phases automatisées :
- Analyse — L’IA scanne le code source du logiciel et identifie toutes les actions possibles (menus, API, scripts)
- Conception — Elle architecte les commandes CLI, le modèle de données et les formats de sortie
- Implémentation — Elle génère un CLI complet en Python (Click) avec sortie JSON structurée
- Planification des tests — Création d’un plan de tests unitaires et end-to-end
- Écriture des tests — Implémentation de la suite de tests
- Documentation — Génération automatique de la doc et des SKILL.md
- Publication — Packaging et installation via pip
Tout cela en une seule commande :
/cli-anything:cli-anything ./gimp
16 logiciels déjà supportés
L’équipe a validé l’approche sur 16 applications majeures couvrant des domaines très variés :
| Logiciel | Domaine | Tests |
|---|---|---|
| GIMP | Édition d’image | 107 tests |
| Blender | Modélisation 3D | 208 tests |
| Inkscape | Dessin vectoriel | 202 tests |
| Audacity | Production audio | 161 tests |
| LibreOffice | Suite bureautique | ✅ |
| OBS Studio | Streaming live | ✅ |
| FreeCAD | CAO 3D | 258 commandes |
| MuseScore | Notation musicale | ✅ |
| Draw.io | Diagrammes | ✅ |
| Krita | Peinture numérique | ✅ |
| Zoom | Visioconférence | ✅ |
| Zotero | Gestion bibliographique | ✅ |
Au total : 1 839 tests passent avec succès sur l’ensemble des applications.
Pourquoi le CLI plutôt que le MCP ou le screen scraping ?
Le choix de l’interface en ligne de commande n’est pas anodin. Comparé aux autres approches :
- Structuré et composable — Les commandes texte correspondent naturellement au format des LLM et se chaînent facilement
- Universel — Fonctionne sur tous les OS, sans dépendances lourdes
- Auto-documenté — Le flag
--helppermet à l’agent de découvrir les commandes disponibles - Déterministe — Contrairement au screen scraping (vision), les résultats sont reproductibles
- Sortie JSON — L’agent récupère des données structurées, pas du texte à parser
Compatible avec les principaux agents IA
CLI-Anything s’intègre comme plugin avec :
- Claude Code (Anthropic) — installation en une commande via le marketplace
- OpenClaw, OpenCode, Codex (OpenAI)
- Cursor, GitHub Copilot CLI
Un CLI-Hub centralise tous les CLI générés par la communauté : on peut chercher, parcourir et installer n’importe quel CLI avec un simple pip install.
Ce que ça change
CLI-Anything transforme la relation entre IA et logiciels. Au lieu de construire des intégrations spécifiques pour chaque application (comme les serveurs MCP), on génère automatiquement l’interface universelle. Un agent IA peut alors :
- Retoucher des photos par lots dans GIMP
- Générer des rendus 3D dans Blender
- Créer et formater des documents LibreOffice
- Monter de l’audio dans Audacity
- Dessiner des schémas dans Draw.io
Le tout en langage naturel, avec des résultats fiables et vérifiables.
Liens :