Utilisations de l'API OpenAI
La structure du client API OpenAI fournie révèle plusieurs cas d'utilisation courants pour interagir avec les modèles d'OpenAI :
-
IA conversationnelle basée sur le chat : Le cas d'utilisation le plus proéminent, exposé via
client.chat.completions.create
. Cela permet des conversations multi-tours en envoyant une liste de messages et en recevant des réponses générées par le modèle.- Génération de texte : Créer du contenu textuel de type humain, comme des articles, des résumés, de l'écriture créative ou des extraits de code, en fournissant une requête textuelle (prompt) dans le cadre des messages de chat.
- Interactions multimodales (Vision et Audio) : Le paramètre
audio
et lesmodalities
(supportant"text"
et"audio"
) au sein dechat.completions.create
indiquent la capacité à traiter et générer différents types de contenu au-delà du texte, y compris l'audio (par exemple, la synthèse vocale) et implicitement, d'après les indications de la documentation, le traitement d'images (vision). - Utilisation d'outils (Appel de fonctions) : Les paramètres
tools
ettool_choice
danschat.completions.create
permettent aux modèles de déterminer intelligemment quand et comment appeler des fonctions ou des outils externes en fonction du contexte de la conversation, facilitant ainsi l'intégration avec des systèmes ou des bases de données externes. - Génération de sorties structurées : Le paramètre
response_format
permet aux développeurs d'indiquer au modèle de renvoyer des réponses dans un format spécifique, tel que JSON, ce qui facilite l'intégration des sorties du modèle dans des flux de travail programmatiques ou des applications nécessitant des données structurées. - Réponses en temps réel et en streaming : Le paramètre
stream
prend en charge la réception incrémentielle des réponses du modèle à mesure qu'elles sont générées, ce qui est crucial pour la création d'interfaces utilisateur réactives pour les chatbots ou d'autres applications interactives.
-
Génération d'embeddings : La présence de
client.embeddings
suggère un cas d'utilisation courant pour convertir du texte ou d'autres données en représentations vectorielles numériques. Ces embeddings sont fondamentaux pour :- La recherche de similarité.
- Le clustering (regroupement).
- Les systèmes de recommandation.
-
Gestion de fichiers : Les composants
client.files
etclient.uploads
indiquent la capacité à télécharger, gérer et récupérer des fichiers, qui peuvent être utilisés pour :- L'affinement de modèles avec des jeux de données personnalisés.
- La fourniture de contexte pour des requêtes (prompts) plus longues.
-
Génération et manipulation d'images : Le composant
client.images
pointe vers des fonctionnalités pour :- La création d'images à partir de descriptions textuelles (texte-vers-image).
- L'édition ou la génération de variations d'images existantes.
-
Traitement audio : Le
client.audio
implique des capacités pour :- La parole-vers-texte (transcription).
- La synthèse vocale (texte-vers-parole).
-
Modération de contenu : La ressource
client.moderations
indique une fonctionnalité pour :- La détection de contenu dangereux ou interdit dans les entrées utilisateur ou les sorties du modèle.
-
Gestion de modèles : Le
client.models
permet de :- Lister les modèles disponibles.
- Récupérer des détails sur des modèles spécifiques.
-
Affinement de modèles : La ressource
client.fine_tuning
est destinée à :- La personnalisation des modèles OpenAI avec des données propriétaires pour améliorer les performances sur des tâches spécifiques.
-
Gestion des bases de données vectorielles (Vector Store) : Le
client.vector_stores
suggère un support pour la gestion de bases de données vectorielles, qui sont souvent utilisées avec les systèmes RAG (Génération Augmentée par Récupération) pour fournir aux modèles un accès à des connaissances externes. -
Traitement par lots (Batch Processing) : La ressource
client.batches
implique une fonctionnalité pour soumettre plusieurs requêtes API en un seul lot, utile pour :- Traiter de grands volumes de données plus efficacement.
- Gérer les limites de débit pour les opérations en masse.
-
Récupération et gestion des complétions stockées : Les méthodes
retrieve
,update
,list
etdelete
sousclient.chat.completions
(lorsquestore=true
est utilisé pendant la création) permettent de :- Accéder aux interactions conversationnelles passées pour l'audit, l'analyse ou un traitement ultérieur.
- Mettre à jour les métadonnées associées aux interactions stockées.