Qu'est-ce que VisualGPT – Tout ce que vous devez savoir

Qu Est Ce Que Visualgpt Tout Ce Que Vous Devez Savoir



VisualGPT de Microsoft lance une nouvelle technologie » VisuelGPT ' qui constitue une avancée de l'IA et ouvre des possibilités pour des expériences d'IA plus attrayantes et interactives en comblant le fossé entre les visuels et le langage.

Qu’est-ce que VisualGPT ?

VisualGPT est une version étendue de ChatGPT qui est basée sur des modèles NLP (Natural Language Processing), mais dans VisualGPT, VFMS est utilisé pour convertir les requêtes de texte en forme d'image. C’est tel qu’il s’agit d’une combinaison/intégration de requêtes texte et image.







Objectif de VisualGPT

Après la sortie sur le marché de ChatGPT qui travaillait uniquement sur le format textuel, pour atteindre le prochain niveau d'avancement, il existe l'outil parfait qui fonctionnera du format textuel au format graphique, pour toutes ces raisons et dans la course à l'IA. Microsoft lance VisualGPT. L'objectif principal de VisualGPT est de créer des images IA à la demande de l'utilisateur ou d'analyser l'image.



Architecture de VisualGPT

VisualGPT contient la requête utilisateur, le gestionnaire d'invites, les modèles de base visuelle (VFM), le principe du système, l'historique du dialogue, l'historique du raisonnement et la réponse intermédiaire.



Si nous parlons spécifiquement de son modèle, c’est-à-dire « VFM (modèles de fondation visuelle) », près de 22 VFM sont utilisés, comme BLIP (Bootstrapping Language-Image Pre-training) et Stable Diffusion.





Comment exécuter un ChatGPT visuel ?

Pour exécuter un Visual ChatGPT, considérez les étapes suivantes :

Étape 1 : Créer un environnement

Tout d'abord, vous devez créer un environnement Python version 3.8 :



système d'importation

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

Étape 2 : Cloner le fichier Visual ChatGPT

Maintenant, clonez le fichier visuel ChatGPT depuis GitHub à l'aide de la commande suivante :

! clone git https : // github.com / deepanshu88 / visuel-chatgpt.git

Étape 3 : configurer un nouveau répertoire

Après cela, créez un nouveau répertoire via la commande ci-dessous :

% CD chatgpt visuel

Étape 4 : Installer les packages requis

Maintenant, installez les packages requis en utilisant le ' pépin ' Applet de commande :

! boucler https : // bootstrap.pypa.io / get-pip.py -O get-pip.py

! python3.8 get-pip.py

! python3.8 -m pépin installer -r exigences.txt

Étape 5 : Accédez à l’API OpenAI

Après avoir installé les packages initiaux, accédez à l'API OpenAI en obtenant une clé API auprès de « platform.openai.com » et en effectuant des appels API authentifiés :

% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

Étape 6 : Choisissez le modèle

Enfin, après avoir accédé à Openai, choisissez le modèle. Il existe plus de 20 modèles utilisés dans visualGPT que vous pouvez choisir selon vos besoins :

! python3.8 . / visual_chatgpt.py --charger Text2Image_cuda : 0

Dans la commande ci-dessus, ' Texte2Image » correspond au modèle à utiliser. Pour plus de détails, consultez ce Google Colab carnet de notes .

Conclusion

ChatGPT a été introduit pour obtenir des réponses spécifiques à n'importe quelle requête et Microsoft a maintenant lancé VisualGPT, capable de traiter des données textuelles et picturales. Il est tel que l'utilisateur peut simplement ajouter ses exigences sous forme textuelle et obtenir sa sortie graphique.