NewsGuardin äskettäinen tutkimus paljastaa, että johtavat AI -chatbotit, mukaan lukien Openain ja Meta -tutkimukset, tarjoavat vääriä tietoja suunnilleen yhdellä jokaisesta kolmesta vastauksesta. Raportissa korostetaan trendiä koskevaa: Chatbots valmistaa yhä todennäköisemmin vastauksia sen sijaan, että myöntäisivät tiedon puutteen, mikä johtaa korkeampaan valheiden määrään verrattuna vuoteen 2024. US-pohjainen uutisluokitusyritys NewsGuard arvioi vastausten tarkkuutta kymmenen suosituimmasta AI-työkalun luotettavuudesta ylläpitääkseen.
Chatbot -tarkkuus: Alustojen sijoittaminen
NewsGuard -raportti tunnistaa tietyt chatbotit, joilla on vaihteleva tarkkuus. Kierto AI: n PI -chatbotilla oli korkein vääriä väitteitä, ja 57% vastauksista sisälsi epätarkkoja tietoja. Hälytys AI seurasi tiiviisti, ja 47% vastauksista pidettiin väärinä. Laajemmin käytettyjä chatboteja, kuten Openain chatgpt ja Meta -Llaama, osoittivat myös merkittäviä virhetasoja, levittäen valheita 40 prosentilla heidän vastauksistaan. Microsoftin Copilot and Mistral’s Le Chat esittivät virhetasot keskimäärin 35%. Sitä vastoin Antropicin Claude ja Googlen Gemini osoittivat alhaisimmat vikahinnat. Claude tuotti valheita vain 10%: lla vastauksista, kun taas Geminillä oli 17%: n virhearvo. Hälytys AI: lla oli merkittävin tarkkuuden heikkeneminen. NewsGuardin tutkimuksessa ei löytynyt vuonna 2024 vääriä väitteitä vastauksissaan. Elokuuhun 2025 mennessä väärien väitteiden määrä oli kuitenkin noussut 46 prosenttiin. Raportti ei selitä lopullisesti tätä laskua, mutta se toteaa käyttäjän valitukset erillisellä Reddit -foorumilla potentiaalisena indikaattorina ongelmista. Ranskan AI -yritys Mistral ei osoittanut valheellisuuttaan muutosta vuodesta 2024 lähtien pitäen tasaista 37%: n virhearvon. Nämä havainnot ovat yhdenmukaisia ranskalaisen sanomalehden Les Echosin aikaisemman raportin kanssa, joka havaitsi, että Mistral toisti vääriä tietoja Ranskasta, presidentti Emmanuel Macronista ja First Lady Brigitte Macronista 58%: lla englanninkielisistä vastauksista ja 31% ranskalaisista vastauksista. Mistral katsoi nämä kysymykset Le -chat -avustajille, sekä verkkohakuihin liittyvät että itsenäisesti toimivat. Seuraavaksi Euronews otti yhteyttä NewsGuard -raportissa mainittuihin yrityksiin, mutta eivät saaneet välitöntä vastausta.
Desinformaation vaikutus
NewsGuard-raportti paljasti myös, että tietyt chatbotit vetoavat Venäjän desinformaatiokampanjoihin, kuten Storm-1516: een ja Pravdaan, lähteisiin. Nämä kampanjat tunnetaan väärien uutisten luomisesta ja levittämisestä. Yksi raportissa mainittu esimerkki sisältää väitteen, jonka mukaan Moldovanin parlamentin johtaja Igor Grosu ”lammasten lammasparven” verrattuna ”NewsGuard havaitsi tämän väitteen valmistetuksi uutisraportiksi, joka jäljitteli Romanian uutistoimistoa Digi24: tä ja käytti AI: n tuotettua ääntä Grosun äänessä. Mistral, Claude, Inffectionin PI, Copilot, Meta ja hämmentysti toistivat tämän väitteen tosiasiana, ja useissa heistä viittasivat Pravda -verkkopaikkoihin lähteinä. Nämä havainnot ovat erityisen huolestuttavia viimeaikaisista ilmoituksista ja kumppanuuksista, joiden tarkoituksena on parantaa AI -mallien turvallisuutta ja tarkkuutta. Esimerkiksi Openai on väittänyt, että sen viimeisin CHATGPT-5-malli on ”hallusinaationkestävä”, mikä tarkoittaa, että sen ei pitäisi tuottaa valmistettuja vastauksia. Samoin Google ilmoitti, että Gemini 2.5 ”kykenee päättelemään ajatustensa kautta ennen vastaamista, mikä johtaa parantuneeseen suorituskykyyn ja parannettuun tarkkuuteen”. Näistä väitteistä huolimatta NewsGuard -raportti päättelee, että AI -mallit ”epäonnistuvat edelleen samoilla alueilla, joita he tekivät vuosi sitten”, korostaen jatkuvia haasteita näiden järjestelmien luotettavuuden varmistamisessa.
Tutkimuksen menetelmä
Tutkimuksensa suorittamiseksi NewsGuard arvioi chatbotien vastaukset kymmeneen väärään väitteeseen. Tutkijat käyttivät kolmea erityyppistä kehotusta: neutraalit kehotteet, johtavat kehotteet, jotka olettivat väärän väitteen olevan totta, ja haitalliset kehotukset, jotka on suunniteltu kiertämään turvatoimenpiteitä. Sitten tutkijat arvioivat, toistiko chatbot väärän väitteen vai hylkäsikö sen kieltäytymällä vastaamasta. Raportissa päätellään, että AI-mallit ”toistavat valheita useammin, kompastuen tietoihin tyhjiin, joissa vain pahanlaatuiset toimijat tarjoavat tietoa, paikallisina myyntipisteinä poseeraavien ulkomaisten verkkosivustojen saamiseksi ja uutis-tapahtumien murtamisen” kuin ne olivat vuonna 2024, mikä korosti jatkuvaa valppautta ja paranemista AI-chattootin kehityksessä.
Source: NewsGuard: Ai Chatbots leviää valheet 33%: lla vastauksista





