Il ne faut plus utiliser ChatGPT pour tout et n'importe quoi : voici les modèles d'IA que j'utilise pour la recherche, le codage et plus encore (et ceux que j'évite)

A retenir sur les choix de modèles d'IA en fonction des cas d'usage
- Différents modèles d'IA gagnent régulièrement en capacité de génération d'images, de codage et de recherche.
- Les intégrations d'applications ajoutent souvent des couches payante coûteuse à l'IA.
- L'obsession de la version du modèle importe moins que le flux de travail qu'il est capable de prendre en charge.
Le rythme de l'évolution dans le monde florissant de l'IA générative est fulgurant. Il est souvent difficile de tout suivre. Surtout, quelle est la différence entre GPT-5.1, Opus 4.5, Gemini 3, etc. Et pourquoi utiliser l'un plutôt que l'autre ?
Pour être honnête, essayer de comprendre pleinement les différences détaillées entre chacun des modèles d'IA est sans objet. Mais il est assez facile, surtout à l'aide d'exemples, de comprendre quels modèles choisir pour différentes tâches. C'est ce que nous allons faire dans cet article.
Les applications et les modèles d'IA sont deux choses différentes
N'oubliez pas que les applications et les modèles d'IA sont deux choses différentes.
- Le modèle est le moteur d'IA sous-jacent qui effectue le traitement de l'intelligence.
- L'application est l'outil que vous utilisez.
Voici un diagramme, créé dans Nano Banana Pro de Google, qui donne une bonne idée de la situation.

Nano Banana Pro/David Gewirtz/ZDNET
L'exemple de la comparaison ChatGPT et Midjourney sur la génération de diagramme
Mais de la même manière que des véhicules différents utilisent des types et des marques de moteurs différents, des applications différentes utilisent des modèles différents. Par exemple, j'ai donné exactement le même prompt qui a produit le diagramme ci-dessus au générateur d'images de ChatGPT (à gauche) et au générateur d'images de Midjourney (à droite), et nous avons obtenu les résultats suivants :

Gauche : ChatGPT/David Gewirtz/ZDNET Droite : Nano Banana Pro/David Gewirtz/ZDNET
Comme vous pouvez le voir, le résultat de ChatGPT est simple et relativement clair, alors que celui de Midjourney est à la fois excessif et n'a pas suivi la consigne. Bref, Midjourney est excellent pour les images conceptuelles, mais il est assez mauvais pour les diagrammes.
Cela dit, gardez toujours à l'esprit la description de mon ami Vinnie Moscaritolo : "L'IA n'est pas l'outil le plus aiguisé de la boîte. Parfois elle est parfaite, et parfois elle plonge directement dans le trou du lapin de la stupidité." Le trou du lapin de la stupidité. Je dois me souvenir de cette phrase.
Le facteur coût/bénéfice
La plupart des entreprises spécialisées dans l'IA vendent leurs modèles à la fois sous forme d'API (que les programmeurs peuvent intégrer dans leurs applications) et sous forme d'applications de chatbot.
Gardez à l'esprit qu'un chatbot d'IA n'est pas une IA en soi. Un chatbot d'IA comme ChatGPT est en réalité une application de chat (comme une application de messagerie ou Slack) qui fait appel à un modèle d'IA.
Bien qu'il existe de très bons chatbots IA gratuits, une fois que vous commencerez à les utiliser souvent, vous achèterez probablement un ou plusieurs des abonnements à environ 20 $/mois proposés par chacun d'entre eux.
Payer pour de la mise à niveau IA ?
Vous avez probablement remarqué que de nombreux éditeurs de logiciels intègrent désormais des fonctionnalités d'IA. J'ai été un utilisateur de QuickBooks Online pendant de nombreuses années, mais aujourd'hui QuickBooks propose des "mises à niveau" pour vous vendre des abonnements à des agents d'intelligence artificielle.

Capture d'écran par David Gewirtz/ZDNET
Certains fournisseurs vous permettent d'utiliser les capacités d'IA des abonnements de chatbot payants que vous payez déjà à l'intérieur de leurs applications. Mais la plupart des fournisseurs d'applications veulent ce flux de revenus supplémentaires. Même si vous payez déjà pour des modèles d'IA comme GPT-5.1 ou Opus 4.5 dans le cadre de votre abonnement de chatbot, la plupart des fournisseurs de logiciels intégrant l'IA vous feront payer leurs propres frais d'accès à ces modèles.
La décision d'utilisation doit être prise en fonction de vos besoins. Pour vous aider à prendre cette décision, je vais passer en revue les modèles que j'utilise pour un grand nombre des différentes tâches que j'accomplis dans le cadre de mon travail. Gardez à l'esprit que je choisis rarement le modèle en premier. Je choisis la tâche et l'application, et le modèle fait généralement partie de cette application.
Création d'explicateurs
Modèles utilisés : Gemini 3 et Gemini 2.5
Un exemple parfait est le NotebookLM de Google, un outil que j'ai ajouté à mon kit il y a environ six mois et que j'utilise maintenant au moins une fois par semaine.
NotebookLM est un outil de bloc-notes intégré à un modèle de langage (d'où NotebookLM). Mais je ne l'utilise pas comme un carnet de notes. Alors que certaines personnes apprécient cette capacité, NotebookLM a un super pouvoir : il crée des explications audio basées sur la source qui lui est fourni.
Vous pouvez choisir si vous voulez un son pur ou une piste audio accompagnée de diapositives. La plupart du temps, j'opte pour l'audio. Lorsque je reçois un document particulièrement dense, un communiqué de presse ou un document technique, je l'introduis dans NotebookLM. Environ 15 minutes plus tard, l'application produit une discussion explorant les points clés et les principales questions de ce que j'ai introduit.
Pour être clair, je n'utilise jamais ces résultats directement dans mon travail. Mais c'est un excellent moyen d'obtenir une triangulation rapide sur les grandes questions liées à ce sur quoi je travaille.
Google ne décrit pas explicitement le modèle qui sous-tend NotebookLM. Mais il s'agit certainement d'une variante de Gemini. Comme Gemini 3 vient de sortir, la plupart des travaux que j'ai effectués avec NotebookLM ont probablement été générés avec Gemini 2.5.
Identification des mots-clés
Modèles utilisés : GPT-4o, GPT-5, GPT-5.1
Vous avez remarqué que j'ai listé trois modèles ci-dessus. C'est parce qu'OpenAI les a mis à jour. Au fur et à mesure des mises à jour, le modèle que j'ai utilisé a été automatiquement mis à jour. C'est pourquoi je ne veux pas que vous soyez obsédé par les versions des modèles. Si vous lisez ceci dans trois mois, tous les modèles seront différents.
Dans ce cas, j'utilise une application web d'archivage auto-hébergée appelée Karakeep. Karakeep a remplacé Pocket en tant que moyen de stockage des articles que j'ai trouvés en vue d'une utilisation ultérieure dans le cadre de mes recherches. Une chose que Karakeep fait et que Pocket n'a jamais pu faire, c'est de créer de très bons mots-clés automatiques.

Capture d'écran par David Gewirtz/ZDNET
Karakeep utilise pour cela l'API d'OpenAI. Parce que Karakeep est hébergé en open source et n'implique pas de frais d'abonnement, il ne prélève pas sa taxe sur l'IA sur les frais. Au lieu de cela, j'utilise une clé API fournie par OpenAI, et je paie OpenAI en fonction de mon utilisation.
J'ai 24 594 articles indexés dans Karakeep. Le transfert de mes listes de Pocket à Karakeep a pris environ deux mois, car Karakeep a dû rescanner chaque article. Il a également fait appel à OpenAI pour que l'IA puisse générer des mots-clés. Ce processus m'a coûté environ 40 dollars.
Depuis la conversion initiale, j'ai été facturé 5 $ tous les deux mois. Cela en vaut la peine.
Codage
Modèles utilisés: ChatGPT 5.1, GPT-5.1-Max, Claude Opus 4.5
J'utilise les modèles d'IA de deux manières très différentes lorsque je code.
- Pour les projets où je dépose un morceau de code dans le chatbot et où je demande ce qu'il fait, ce qui ne va pas, ou pourquoi j'obtiens un message d'erreur, je n'ai rien trouvé de mieux que ChatGPT Plus utilisant GPT-5.1.
- Cependant, lorsque je fais du codage agentique, Codex d'OpenAI utilisant GPT-5.1-Max et Code Claude utilisant Opus 4.5 sont étonnamment bons. Le codage d'IA agentique consiste à connecter les IA à mon environnement de développement, à laisser les IA lire l'ensemble de ma base de code, puis à effectuer des tâches substantielles en plusieurs étapes.
Par exemple, j'ai utilisé Codex pour écrire quatre plugins WordPress en quatre jours. Tout récemment, j'ai utilisé Claude Code avec Opus 4.5 pour construire une application iPhone, qu'il m'a aidé à réaliser par petits sprints sur une période d'environ un demi-mois. J'ai dépensé 200 $ pour le mois d'utilisation de Codex et 100 $ pour le mois d'utilisation de Claude Code.
Je suis étonné qu'Opus 4.5 ait obtenu de si mauvais résultats dans l'expérience du chatbot, mais qu'il ait été une superstar dans l'expérience du codage agentique. Mais c'est aussi pour cela que nous examinons différents modèles. Les fournisseurs d'IA sont encore en train de régler les problèmes de cette technologie naissante.
Bases de données Notion
Modèles utilisés : Claude, ChatGPT, Gemini
Malgré mon agacement face à la politique de Notion qui vend des add-on au détriment des fonctionnalités de base du produit, je me suis finalement résigné à payer la taxe sur l'IA de Notion pour cette année.
Ce n'est pas ainsi qu'il l'appelle, bien sûr. Au lieu de cela, Notion propose des capacités d'essai d'IA très limitées avec son abonnement Plus à 9,5 €/mois. Il faut passer à l'offre professionnelle à 19,5 €/mois pour bénéficier réellement des fonctionnalités d'IA.
J'utilise Notion AI pour deux choses.
Recherche et résumé
La première est la recherche et le résumé de mes projets d'articles. ZDNET n'autorise pas les IA externes à accéder à ses articles, mais j'ai souvent besoin de me replonger dans mes articles précédents pour revoir ce que j'ai écrit. Je peux diriger Notion AI vers ma bibliothèque de brouillons et elle la parcourra entièrement, non seulement en recherchant des articles, mais aussi en résumant ce que j'ai dit précédemment.
C'est très utile pour des missions telles que "Résumez ce que j'ai écrit sur les laboratoires domestiques en consultant la base de données des blogs".

Capture d'écran par David Gewirtz/ZDNET
Comme vous pouvez le voir sur la capture d'écran ci-dessus, je peux ouvrir la fenêtre de Notion AI et lui poser des questions pendant que j'écris. L'article que vous voyez sur la capture d'écran est cet article, encore en cours de rédaction.
Transformer des listes gigantesques en bases de données catégorisées
Notion AI me permet également de transformer des listes gigantesques en bases de données catégorisées. Dans le cadre d'un projet, j'ai rassemblé une longue liste d'outils de programmation liés à l'IA, mais je voulais pouvoir sélectionner et visualiser les outils par fournisseur et par catégorie.
J'ai donné la liste à Notion, qui a créé une base de données pour moi. Ce n'est pas parfait. Mais c'est utilisable.
Notion n'utilise pas un seul modèle. Il a tendance à passer de Claude à ChatGPT et à Gemini (et à leurs différents modèles) en fonction de ce qu'il pense être le meilleur pour le travail à accomplir et du modèle qui peut le faire au moindre coût.
Reconnaissance vocale
Modèle: Parakeet
J'utilise assez souvent la fonction de dictée du Mac. Mais récemment, j'ai commencé à explorer les programmes de dictée qui offrent des capacités de reconnaissance et d'analyse vocales plus avancées. L'un de ces outils est Paraspeech. Paraspeech propose deux fonctions que je trouve très intéressantes.
- Premièrement, vous ne payez qu'une fois. Il n'y a pas de frais d'abonnement.
- Cela est possible grâce à sa deuxième caractéristique : l'IA fonctionne sur votre propre machine. Lorsque vous installez Paraspeech, il télécharge une variante du modèle de reconnaissance vocale Nvidia Parakeet. L'avantage est que votre discours n'est pas envoyé dans le cloud. Elle reste sur votre machine.
Cet exemple montre comment un modèle d'IA peut différer considérablement d'autres modèles. Ce modèle fonctionne sur mon propre ordinateur. Il est conçu spécifiquement pour la reconnaissance vocale. Et il est inclus dans l'application, plutôt que d'être appelé par elle. Cela permet au développeur de facturer un prix unique sans avoir à reverser des frais d'utilisation au fournisseur d'IA. Cela peut également donner au développeur un avantage commercial, car le fait de payer une fois est quelque chose de très attrayant pour la plupart des consommateurs. Nous payons tous des frais d'abonnement lorsque c'est nécessaire, mais personne ne les aime.
Deep research
Modèles : GPT-5.1 Thinking (dans ChatGPT Pro)
La recherche approfondie (Deep Research) est le processus par lequel l'IA passe beaucoup de temps à trouver des réponses et à fournir des informations. Elle utilise souvent une grande quantité de ressources de l'IA. Et son accès est donc plus coûteux. À l'époque où je disposais de l'abonnement Pro à 200 $/mois pour ma programmation, j'ai également utilisé la recherche en profondeur pour réaliser des choses assez étonnantes.
Mon exemple préféré est celui où j'ai demandé à Deep Research de créer un document d'information marketing à partir d'un code source. J'ai utilisé un prompt assez long, je vais donc me contenter de le résumer. Ce que je lui ai dit, c'est qu'il existe un processus assez standard au cours duquel les responsables de l'ingénierie informent les responsables du marketing et des produits de ce que fait un élément de technologie.
Les responsables du marketing utilisent ensuite ce briefing, qui comprend des caractéristiques, des anecdotes techniques (pensez à la présentation d'Apple) et des cas d'utilisation, comme base pour les aider à produire tous leurs documents et activités de marketing.
Lire 12 000 lignes de code des fichiers de code source
Mais je n'avais pas de responsable de l'ingénierie. Au lieu de cela, j'ai demandé à Deep Research de lire les plus de 12 000 lignes de code des fichiers de code source, d'en déduire ce que faisaient les produits et, à partir de là, de rédiger les documents d'information. Les résultats ont été étonnants. L'IA s'est trompée sur quelques points mineurs, mais il a été facile de les corriger.
J'ai ensuite relevé le niveau en prenant ces documents d'information et en les transmettant à NotebookLM, qui a produit des diaporamas convaincants, annotés par la voix, décrivant les produits. C'était à la fois étonnant, fascinant et terrifiant.
Cependant, comme je suis mon propre ingénieur et chef de produit, les deux IA m'ont probablement permis d'économiser 60 à 80 heures de travail de gestion de produit.
Analyse, référencement et utilisation générale
Modèle : GPT-5.1 Auto
Mon outil de prédilection pour les opérations d'IA de support aux entreprises est le niveau Plus de ChatGPT. Bien qu'il puisse parfois être incroyablement peu coopératif, il est également très utile. Même si je ne gagnais pas ma vie en écrivant sur l'IA, je conserverais probablement mon abonnement de 20 $ par mois. Je laisse généralement le modèle en mode Auto, ce qui permet à l'IA de choisir le niveau de traitement pour chaque question.
En termes d'utilisation pratique, je trouve que le niveau Plus est particulièrement utile pour l'analyse des données. Je l'alimente avec de grandes feuilles de calcul contenant différents types de données, comme l'analyse des sentiments, et je lui demande de les traiter, de les digérer, de trouver les points clés et de me renvoyer les résultats. Je l'utilise également pour choisir des mots-clés de référencement pour mes vidéos YouTube.
Jusqu'à présent, aucun autre chatbot n'a été aussi utile. Cependant, Gemini 3 semble pouvoir donner du fil à retordre à ChatGPT. Qui sait, dans six mois, cette catégorie pourrait citer Gemini 3 comme le modèle préféré au lieu de GPT-5.1.
Outils et modèles que je n'utilise pas
Parmi les grands noms, je n'utilise pas Perplexity, Copilot ou Grok.
- Je sais que Perplexity utilise également GPT-5.1, mais je ne l'ai jamais trouvé intéressant. Il est connu pour ses fonctions de recherche, mais les quelques fois où j'ai essayé de faire des recherches, les résultats ont été médiocres. De plus, je ne supporte pas le fait que l'on doive se connecter par email.
- Copilot est un cas intéressant. Je n'utilise pratiquement plus de produits Microsoft aujourd'hui. Je conserve mon abonnement familial à Microsoft 365 Family car je connais Excel et PowerPoint sur le bout des doigts. Mais je ne travaille plus beaucoup avec Excel ou PowerPoint. Copilot est étroitement intégré à ces outils, il ne s'est donc pas encore avéré aussi convaincant.
- Quant à Grok, j'ai été surpris de voir à quel point il s'est bien comporté lors de mes tests de codage. Mais il n'arrive pas à la cheville du Codex d'OpenAI ou de Claude Code. Je vais continuer à le tester, et rien n'est coulé dans le béton, mais il est retiré de ma liste pour l'instant.
Source : Lire l'article original