OpenAI: Το νέο GPT-4o σε ακούει, σου μιλάει και σε διαβάζει σε πραγματικό χρόνο
Shutterstock
Shutterstock

OpenAI: Το νέο GPT-4o σε ακούει, σου μιλάει και σε διαβάζει σε πραγματικό χρόνο

Με την ονομασία GPT-4o κάνει το ντεμπούτο του το νέο μοντέλο Τεχνητής Νοημοσύνης της κατασκευάστριας του ChatGPT, ΟpenAI, σύμφωνα με το Reuters.  Όπως μεταδίδει το CNBC, η εταιρεία λάνσαρε τη Δευτέρα (13/05) το νέο μοντέλο AΙ, αλλά και μια έκδοση desktop του ChatGPT, μαζί με μια ενημερωμένη διεπαφή χρήστη.

Σύμφωνα με την εταιρεία πρόκειται για ένα βήμα προς μία πολύ πιο «φυσική» αλληλεπίδραση ανθρώπου - υπολογιστή, καθώς το νέο μοντέλο έχει τη δυνατότητα για φωνητική συνομιλία, αλλά και την ικανότητα να αλληλεπιδρά σε κείμενο. 

Η OpenAI δήλωσε ότι θα διαθέσει το νέο της μοντέλο Τεχνητής Νοημοσύνης μέσα στις επόμενες εβδομάδες. 

Η επικεφαλής τεχνολογίας Mira Murati σε  εκδήλωση που μεταδόθηκε ζωντανά, σημείωσε ότι το νέο μοντέλο - στο οποίο θα έχουν πρόσβαση όλοι οι χρήστες της OpenAI -  είναι «πολύ πιο γρήγορο», με βελτιωμένες δυνατότητες σε κείμενο, βίντεο και ήχο.

Παράλληλα, η OpenAI δήλωσε ότι τελικά σχεδιάζει να επιτρέψει στους χρήστες να κάνουν video chat με το ChatGPT.

Οι νέες ηχητικές δυνατότητες επιτρέπουν στους χρήστες να μιλούν στο ChatGPT και να λαμβάνουν απαντήσεις σε πραγματικό χρόνο χωρίς καθυστέρηση, καθώς και να διακόπτουν το ChatGPT ενώ μιλάει, ανέφεραν οι ερευνητές της OpenAI.

Κατά την επίδειξη από τους ερευνητές της OpenAI, ο φωνητικός βοηθός ChatGPT ήταν σε θέση να διαβάσει ένα παραμύθι με διαφορετικές φωνές, συναισθήματα και τόνους.

Σε μια δεύτερη επίδειξη, ο φωνητικός βοηθός ChatGPT χρησιμοποίησε τις δυνατότητες όρασης για να λύσει μια μαθηματική εξίσωση γραμμένη σε ένα φύλλο χαρτί, ενώ δεν παραλείπεται η ικανότητα του μοντέλου GPT-4o να μεταφράζει γλώσσες σε πραγματικό χρόνο.

Η επικεφαλής τεχνολογίας της εταιρείας, Μίρα Μουράτι, δήλωσε στην εκδήλωση ότι το νέο μοντέλο GPT-4o θα διατίθεται δωρεάν τονίζοντας ότι πρόκειται σαφώς για πιο αποτελεσματικό μοντέλο από τα προηγούμενα.

Το «o» στο GPT-4o σημαίνει omni, αναφέρει το CNBC. Το νέο μοντέλο επιτρέπει στο ChatGPT να χειρίζεται 50 διαφορετικές γλώσσες με βελτιωμένη ταχύτητα και ποιότητα, και θα είναι επίσης διαθέσιμο μέσω του API του OpenAI, καθιστώντας δυνατή τη δημιουργία εφαρμογών από τους προγραμματιστές που χρησιμοποιούν το νέο μοντέλο από σήμερα, δήλωσε η Μουράτι.

Πηγή: Reuters, CNBC, OpenAI