Na George Mason University vo Virgínii sa zaoberáte oblasťou počítačového videnia a multimodálneho učenia pre robotiku, ktorá je úzko prepojená s umelou inteligenciou. Kde v praxi sa môžeme stretnúť s výsledkami vášho výskumu?
Dnes majú bežní používatelia k dispozícii mnohé praktické aplikácie, v ktorých sa používajú veľké jazykové modely. Zároveň existujú ďalšie aplikácie, ktoré sa snažia do interakcií v prirodzenom jazyku zakomponovať aj obrázky. Využitie nachádzajú povedzme v medickej doméne, ale aj v oblasti médií, keď treba obrázky opisovať alebo analyzovať. Veľkú časť vývoja a výskumu tohto druhu pritom predstavuje snaha vytvoriť výpočtové modely toho, ako funguje inteligencia a celkovo ľudské vnímanie.
Čiže stroj, ktorý v podstate myslí a vníma ako ľudská bytosť? Blížime sa k takémuto bodu?
Niektoré z týchto vecí sú už obsiahnuté v určitých konkrétnych aplikáciách. Povedala by som, že svätým grálom výskumu umelej inteligencie je vytvoriť také systémy a modely, ktoré všetky tieto modality dajú dokopy.
To znamená, že keď pracujeme napríklad s ChatGPT a k tomu dodáme rôzne obrázky, videá či iné vnemy, tak dostaneme akéhosi predchodcu umelej mysliacej bytosti?
Plus sa k tomu spracovávajú aj audio signály či ďalšie vnemy. V podstate ide o zakomponovanie všetkých zmyslových informácií do jedného celku tak, aby človek mohol analyzovať situáciu, prípadne prijímal rozhodnutia, ak je daný systém prepojený s nejakými rozhodovacími mechanizmami.
S akým produktom založeným na týchto technológiách budeme môcť v budúcnosti pracovať?
Veľa takýchto systémov dokáže v budúcnosti napríklad sprostredkúvať komunikáciu medzi počítačom a človekom v prirodzenom jazyku. To je však len jeden smer, ktorým sa toto odvetvie rozvíja. V jednotlivých doménach pôjde aj o spracovanie dát a extrahovanie informácií – nielen v zmysle ich vyhľadávania, ale aj zodpovedania otázok. V podstate sa tak vytvoria kauzálne myšlienkové pochody – a práve tieto modely ich budú kvázi urýchľovať a zlepšovať. V momentálnej etape vývoja však zatiaľ stále len premýšľame nad mechanizmami, ktoré uľahčia komunikáciu človeka s výpočtovými systémami spracovávajúcimi jednotlivé informácie.
Zostáva vám 79% na dočítanie.
