Tekst objavljen: 12.09.2025 17:15        


Google je predstavio novu opciju unutar svoje AI aplikacije Gemini koja omogućava trenutno pretvaranje audio snimaka u tekstualne transkripte

Gemini pretvara audio snimke u tekst za samo jednu sekundu


Korisnici sada mogu da pošalju audio fajl, a sistem će ga u roku od sekunde pretvoriti u transkript sa vremenskim oznakama i prepoznavanjem govornika.

Ova funkcija je izuzetno korisna za profesionalce i studente, koji više neće morati da troše sate na ručno preslušavanje sastanaka, intervjua ili predavanja.

Jednostavna upotreba i podrška za formate

Nova funkcija je dostupna i u mobilnoj i u web verziji Geminija. Za njeno korišćenje dovoljno je kliknuti na znak plus i odabrati opciju za slanje fajla. Podržani su najpopularniji formati, kao što su MP3, M4A i WAV.


AI prepoznaje govornike i beleži tačno vreme

Gemini ne samo da prepisuje zvuk, već i automatski dodaje precizne vremenske oznake kako bi olakšao pronalaženje ključnih delova razgovora. Još jedna važna karakteristika je automatsko prepoznavanje govornika. AI detektuje promene u glasu i jasno označava ko je kada govorio, što je izuzetno korisno za analizu složenih dijaloga.

Iako postoji ograničenje od deset audio fajlova po sesiji, brzina i tačnost Geminija oduševljavaju prve korisnike ove AI aplikacije.

Ostavi komentar


Pročitao/la sam i prihvatam uslove korišćenja




Povezane teme:
google gemini prebacivanje audio fajla u tekst veštačka inteligencija google

Kalkulator dozvoljenog minusa
Dozvoljeni minus
Nedozvoljeni minus
dana