Google je predstavio novu opciju unutar svoje AI aplikacije Gemini koja omogućava trenutno pretvaranje audio snimaka u tekstualne transkripte
Korisnici sada mogu da pošalju audio fajl, a sistem će ga u roku od sekunde pretvoriti u transkript sa vremenskim oznakama i prepoznavanjem govornika.
Ova funkcija je izuzetno korisna za profesionalce i studente, koji više neće morati da troše sate na ručno preslušavanje sastanaka, intervjua ili predavanja.
Jednostavna upotreba i podrška za formate
Nova funkcija je dostupna i u mobilnoj i u web verziji Geminija. Za njeno korišćenje dovoljno je kliknuti na znak plus i odabrati opciju za slanje fajla. Podržani su najpopularniji formati, kao što su MP3, M4A i WAV.
AI prepoznaje govornike i beleži tačno vreme
Gemini ne samo da prepisuje zvuk, već i automatski dodaje precizne vremenske oznake kako bi olakšao pronalaženje ključnih delova razgovora. Još jedna važna karakteristika je automatsko prepoznavanje govornika. AI detektuje promene u glasu i jasno označava ko je kada govorio, što je izuzetno korisno za analizu složenih dijaloga.
Iako postoji ograničenje od deset audio fajlova po sesiji, brzina i tačnost Geminija oduševljavaju prve korisnike ove AI aplikacije.
Ostavi komentar