OpenAI može klonirati glas govornika na temelju snimke od samo 15 sekundi

Prije nekoliko dana “” je predstavio novi alat koji još jednom dokazuje koliki potencijal ima umjetna inteligencija (AI). Tvrtka je osmislila alat za kloniranje glasa pod nazivom ‘Voice Engine’ koji može oponašati glas bilo kojeg govornika analizirajući samo 15-sekundni audio uzorak. OpenAI kaže da je tehnologija sposobna generirati “govor koji zvuči prirodno s emotivnim i realističnim glasovima”.

Tehnologija se temelji na postojećem API-ju tvrtke za pretvaranje teksta u govor i razvija se od 2022. “OpenAI” na svom blogu, kako zvuči glas koji generira “Voice Engine” i mora se reći da je vrlo realističan.

Oglašavanje

Iz tvrtke kažu da bi takvo rješenje moglo biti korisno za učenje čitanja, za prevođenje jezika, kao i za one koji pate od poremećaja govora. S ovom tehnologijom, OpenAI je sudjelovao u pilot programu na Sveučilištu Brown, koji je pomogao pacijentu s poremećajem govora korištenjem glasa koji je generirao Voice Engine na temelju snimljenog zvuka za školski projekt.

Unatoč potencijalnim prednostima, već je jasno da bi se alat Voice Engine također naširoko koristio u zlonamjerne svrhe, poput stvaranja dubokih krivotvorina. To je posebno aktualno sada, kada su u tijeku pripreme za američke predsjedničke izbore. Stoga OpenAI mora riješiti potencijalne probleme s privatnošću prije nego što ponudi ovu tehnologiju širem krugu korisnika. Tvrtka je to već donekle riješila, rekavši da će svatko tko koristi alat morati otkriti svojoj publici da je glasove generirala umjetna inteligencija.

Rating
( No ratings yet )
Loading...
VRT