StoryEditor

Ako ukrajinský startup dokázal oživiť hlas Jula Satinského

22.11.2022, 00:00

Na vytvorenie piatich minút nového textu sa použila technológia deep learning. Využíva neurónovú sieť, ktorá pracuje s pôvodnými audio nahrávkami.

Darth Vader, Luke Skywalker,... a Julo Satinský. Ako je možné, aby hovorili dnes slová, ktoré nikdy nenahrali? Hovorí sa tomu "Speech to speech" spôsob spracovania hlasu. Potrebná je na to umelá inteligencia AI, ktorá dokáže na základe vstupných dát - v tomto prípade pôvodný Julov hlas - vytvoriť jeho syntetickú zvukovú kópiu.

Pracoval na nich ukrajinský startup Respeecher, ktorého špecialitou je práve vytváranie syntetického hlasu s využitím technológie „deep learning“.

Ako je to možné?

Respeecher musel v prvom rade naučiť umelú inteligenciu slovenčinu a imitovať aj jej fonetiku. Táto fáza jej trvala približne mesiac.

Samozrejme musela spracovať aj hlas samotného Jula Satinského. „Väčšina obsahu pochádzala z analógových nahrávok, ktoré boli vytvorené začiatkom 90-tych rokov. Najnovšia z použitých nahrávok hlasu Júliusa Satinského bola vytvorená v roku 1994,“ vysvetľuje Volodymyr Ovsiienko, Business Development Executive ukrajinskej spoločnosti Respeecher.

O emócie sa postaral Michal Hudák

Nakoniec vyselektovali 40 minút čistého zvukového záznamu, ktorým neskôr trénovali umelú inteligenciu na tento charakteristicky hlboký hlas. Julove posolstvá nie sú zasadené do obdobia 90. rokov. Sú ušité na mieru dnešnému svetu, pričom si zachovávajú filozofiu a názory Jula Satinského. Kľúčový bol najmä súhlas jeho rodiny a majiteľov pôvodných Julových nahrávok. Pre pozitívny spôsob využitia tejto najmodernejšej AI technológie sa ako prvá na Slovensku rozhodla Slovenská sporiteľňa

image

Podkladový hlas nahrával Michal Hudák 

Slovenská Sporiteľňa

Umelá inteligencia má však oproti ľuďom jednu veľkú nevýhodu – nedokáže napodobniť autentické emócie. Napriek tomu, že bola farba hlasu na nerozoznanie od originálu, bolo potrebné, aby do prejavu vniesol život hlasový herec. V tomto prípade to bol Michal Hudák, ktorý mal za úlohu nahrať repliky s čo najautentickejším tempom reči, intonáciou a frázovaním podobným Julovi. Na takúto nahrávku sa potom aplikoval výsledný produkt umelej inteligencie. Celý proces výroby trval sedem týždňov, pričom polovicu tohto času zabralo len samotné vzdelávanie počítača historickými nahrávkami. Celkovo vďaka tomu vzniklo 5 minút audio materiálu so Satinského hlasom, ktorý znie v novej kampani Slovenskej sporiteľne.

menuLevel = 1, menuRoute = pr-clanky, menuAlias = pr-clanky, menuRouteLevel0 = pr-clanky, homepage = false
24. apríl 2024 23:33