Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. FOTO: Reuters

Aplikácie umelej inteligencie mali faktické chyby v pätine odpovedí, zistil test BBC

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie.

Zhruba pätina odpovedí vygenerovaných najznámejšími západnými aplikáciami umelej inteligencie obsahovala faktické chyby. Vyplýva to z testu, ktorého výsledky dnes zverejnila stanica BBC.

Tím stanice sa pýtal na informácie z článkov obsiahnutých na spravodajskom serveri BBC News. V teste použila chatovacie roboty ChatGPT, Copilot, Gemini a Perplexity.

V rámci testu tím BBC sprístupnil chatovacím robotom obsahy spravodajského servera BBC News a potom im položil otázky. Podľa zverejnených výsledkov malo nejakú formu vady 51 percent vygenerovaných odpovedí. Devätnásť percent odpovedí obsahovalo faktické chyby a 13 percent potom nepresné citácie z článkov na serveri BBC News.

V umelej inteligencii kriticky zaostávame za svetom

Medzi chybnými odpoveďami boli tvrdenia chatovacích robotov, že britský expremiér Rishi Sunak či bývala šéfka škótskej vlády Nicola Sturgeonová sú stále vo funkcii, hoci tomu v čase testu už tak nebolo.

V ďalšej odpovedi napríklad aplikácia AI mylne tvrdila, že britská zdravotnícka služba NHS odporúča elektronické cigarety ako nástroj na skončenie s fajčením.

Novinári BBC News hodnotili presnosť, nestrannosť a tiež vernosť odpovedí pôvodným zdrojom, stoja v hodnotení testu. "Chceli sme vedieť, či (platformy AI) poskytujú presne odpovede na otázky ohľadom správ; a či odpovede verne zodpovedajú správam z BBC News použitých ako zdroje," uviedol šéf tímu, ktorý sa zaoberá umelou inteligenciou v BBC, Pete Archer.

Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. "Je ťažké nevnímať, ako rýchlo pokrivenie (informácií) zo strany AI môže podkopať už aj tak krehkú dôveru ľudí vo fakty a overené informácie," uviedla v komentári šéfka spravodajského servera BBC News Deborah Turnessová.

Čínsky chatbot, ktorý vystrašil americké firmy, ukázal nový trik. Ponúka už aj generátor obrázkov

Podľa testovacieho tímu je zásadné, aby informácie boli presné nezávisle od kanála, ktorý ich prenáša. "Nepresnosť z AI asistentov sa môže ľahko šíriť, kedy sú zdieľané na sociálnych sieťach," uviedol Archer.

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie. Domnievajú sa však, že chatovacie roboty nemôžu v súčasnosti byť zdrojom presných správ. "Chceme, aby AI spoločnosti vypočuli naše obavy a konštruktívne s nami spolupracovali," stojí v záveroch testu. Podobný test chce BBC opakovať v blízkej budúcnosti.

#CHATGPT

Viac o tejto téme

Apple žaluje tvorcov ChatGPT za krádež tajomstiev. OpenAI mala využiť vedomosti bývalých zamestnancov Apple v žalobe uviedol, že organizácia OpenAI zaoberajúca sa vývojom umelej inteligencie povzbudzovala zamestnancov spoločnosti ... Tech

Šéfovia sú posadnutí AI, s ChatGPT sa radia viac než s ľuďmi. Zamestnanci opisujú nový toxický trend na pracoviskách Umelá inteligencia mala firmám šetriť čas. Podľa výpovedí zamestnancov sa však v niektorých prípadoch mení na „neomylného ... TECH

Generácia Z už nehľadá len na sociálnych sieťach. Rastie význam ChatGPT a AI vyhľadávania Generácia Z mení svoje návyky pri vyhľadávaní informácií. Kým ešte pred pár rokmi sa zdalo, že mladí ľudia nahrádzajú ... Aktuálne

Koniec nebezpečným pandémiám? Nový systém OpenAI môže zachrániť milióny životov Má ísť o zásadný softvér, ktorý sa postupne integruje do veľkých vedeckých organizácií. Tech