Fotografija in govor: Povsem nova uporabniška izkušnja ChatGPT
OpenAI, vodilno podjetje na področju razvoja umetne inteligence, je pred kratkim na svoji platformi ChatGPT uvedlo inovativno funkcijo. Ta napredek uporabnikom omogoča, da s sistemom komunicirajo tako, da svoja vprašanja glasovno izražajo ali pa jih predstavijo z naloženimi slikami.
S tem omogoča brezhiben in uporabniku prijazen vmesnik, zaradi česar je izkušnja bolj preprosta in intuitivna. OpenAI načrtuje, da bo to funkcijo v naslednjih dveh tednih najprej objavil za svoje naročnike na ChatGPT premium. Vendar je podjetje zagotovilo, da širši krog uporabnikov ne bo dolgo čakal, saj je dostop obljubljen kmalu po prvi uvedbi.
V praksi bo ChatGPT ob ustnem vprašanju uporabnika to hitro prepisal, ga analiziral z naprednim jezikovnim modelom in nato pripravil glasovni odgovor, kar bo izboljšalo komunikacijo v realnem času.
Podjetje OpenAI je predstavilo nov model za pretvorbo besedila v govor. Ta model lahko ustvari zvok, ki skorajda posnema človeški govor. Potrebuje le besedilo in kratek vzorec govorjenih besed. ChatGPT uporabnikom ponuja pet različic glasu.
Podjetje OpenAI je pojasnilo možnosti uporabe te tehnologije: Predstavljajte si, da med potovanjem posnamete sliko znamenitosti in se v realnem času pogovarjate o njenem pomenu. Ali pa doma fotografirajte vsebino hladilnika in shrambe, vprašajte o predlogih za večerjo in nato zahtevajte podroben recept. Tudi pomoč otroku pri matematiki postane interaktivna; posnemite sliko, označite problematični del in skupaj prejmite navodila.
Vendar pa je OpenAI potrdil tudi pomisleke. Takšne napredne zmožnosti bi se lahko izkoristile in zlonamernim posameznikom omogočile posnemanje javnih osebnosti ali zavajanje.
Vklop glasovnih ukazov v ChatGPT:
- Pojdite v ” Settings” (Nastavitve).
- V mobilni aplikaciji izberite ” New Features” (Nove funkcije).
- Izberite ” Voice calls” (Glasovni klici).
- Pritisnite ikono za slušalke v zgornjem desnem kotu domačega zaslona.
- Med petimi razpoložljivimi možnostmi izberite glasovni klic.
Opomba: Glasovni klici so združljivi z operacijskima sistemoma iOS in Android. Slikovna funkcija pa je dostopna na vseh platformah.