Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. FOTO: Reuters
StoryEditor

Aplikácie umelej inteligencie mali faktické chyby v pätine odpovedí, zistil test BBC

11.02.2025, 15:22
Autor:
ČTKČTK

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie.

Zhruba pätina odpovedí vygenerovaných najznámejšími západnými aplikáciami umelej inteligencie obsahovala faktické chyby. Vyplýva to z testu, ktorého výsledky dnes zverejnila stanica BBC.

Tím stanice sa pýtal na informácie z článkov obsiahnutých na spravodajskom serveri BBC News. V teste použila chatovacie roboty ChatGPT, Copilot, Gemini a Perplexity.

V rámci testu tím BBC sprístupnil chatovacím robotom obsahy spravodajského servera BBC News a potom im položil otázky. Podľa zverejnených výsledkov malo nejakú formu vady 51 percent vygenerovaných odpovedí. Devätnásť percent odpovedí obsahovalo faktické chyby a 13 percent potom nepresné citácie z článkov na serveri BBC News.

image

V umelej inteligencii kriticky zaostávame za svetom

Medzi chybnými odpoveďami boli tvrdenia chatovacích robotov, že britský expremiér Rishi Sunak či bývala šéfka škótskej vlády Nicola Sturgeonová sú stále vo funkcii, hoci tomu v čase testu už tak nebolo.

V ďalšej odpovedi napríklad aplikácia AI mylne tvrdila, že britská zdravotnícka služba NHS odporúča elektronické cigarety ako nástroj na skončenie s fajčením.

Novinári BBC News hodnotili presnosť, nestrannosť a tiež vernosť odpovedí pôvodným zdrojom, stoja v hodnotení testu. "Chceli sme vedieť, či (platformy AI) poskytujú presne odpovede na otázky ohľadom správ; a či odpovede verne zodpovedajú správam z BBC News použitých ako zdroje," uviedol šéf tímu, ktorý sa zaoberá umelou inteligenciou v BBC, Pete Archer.

Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. "Je ťažké nevnímať, ako rýchlo pokrivenie (informácií) zo strany AI môže podkopať už aj tak krehkú dôveru ľudí vo fakty a overené informácie," uviedla v komentári šéfka spravodajského servera BBC News Deborah Turnessová.

image

Čínsky chatbot, ktorý vystrašil americké firmy, ukázal nový trik. Ponúka už aj generátor obrázkov

Podľa testovacieho tímu je zásadné, aby informácie boli presné nezávisle od kanála, ktorý ich prenáša. "Nepresnosť z AI asistentov sa môže ľahko šíriť, kedy sú zdieľané na sociálnych sieťach," uviedol Archer.

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie. Domnievajú sa však, že chatovacie roboty nemôžu v súčasnosti byť zdrojom presných správ. "Chceme, aby AI spoločnosti vypočuli naše obavy a konštruktívne s nami spolupracovali," stojí v záveroch testu. Podobný test chce BBC opakovať v blízkej budúcnosti.

01 - Modified: 2025-06-05 12:00:00 - Feat.: - Title: Debatuješ každý deň s ChatomGPT? Pred tým, ako mu opäť napíšeš s banalitou, zamysli sa nad touto dôležitou vecou 02 - Modified: 2025-05-27 12:55:14 - Feat.: - Title: Každý obyvateľ Arabských emirátov má mať zadarmo prístup k platenej verzii ChatGPT 03 - Modified: 2025-04-30 08:21:59 - Feat.: - Title: GALÉRIA Suchý Madrid či zatopená obľúbená destinácia Slovákov? Takto podľa umelej inteligencie budú vyzerať európske mestá o 100 rokov 04 - Modified: 2025-04-25 09:51:14 - Feat.: - Title: GALÉRIA Vedci odhalili, ako by mohli vyzerať mimozemšťania na planéte K2-18b: Mikroskopický život aj tvory podobné živočíchom 05 - Modified: 2025-04-24 09:26:32 - Feat.: - Title: Slovensko nemá ani diaľnice, Čína s Ruskom chcú dobyť vesmír. Veľmoci plánujú postaviť jadrovú elektráreň rovno na Mesiaci
menuLevel = 2, menuRoute = finweb/zahranicna-ekonomika, menuAlias = zahranicna-ekonomika, menuRouteLevel0 = finweb, homepage = false
21. jún 2025 17:25