Ein Mann benutzt die Webseite ChatGPT von OpenAI

Britische Verbraucherzentrale hat KIs getestet

Die britische Verbraucherorganisation Which? hat sechs KI-Chatbots getestet – mit einem klaren Fazit: Nützlich, aber keineswegs unfehlbar.

Aufbau und Ziel des Tests

Which? ließ sechs weit verbreitete KI‑Systeme gegeneinander antreten: Perplexity, Googles KI‑Zusammenfassungen („AI Mode“/AI Overview), Google Gemini, Microsoft Copilot, ChatGPT und Meta AI. Getestet wurde mit 40 Alltagsfragen aus den Bereichen Geld und Finanzen, Recht, Gesundheit und Ernährung, Verbraucherrechte sowie Reisen. Fachleute bewerteten anschließend, wie korrekt, vollständig und praxistauglich die Antworten waren. Ziel des Tests war herauszufinden, ob sich Verbraucher bei wichtigen Entscheidungen auf KI‑Chatbots verlassen können oder ob sie damit Risiken eingehen.

Die getesteten KI‑Systeme und Ergebnisse

Im Test erreichten alle Systeme nur eine mittelmäßige bis gute Trefferquote – keines lieferte durchgängig verlässliche Antworten. Am besten schnitt Perplexity mit 72 Prozent korrekt beantworteten Fragen ab, dicht gefolgt von Googles KI‑Zusammenfassungen („AI Mode“) mit 70 Prozent. Dahinter lagen Google Gemini mit 68 Prozent, Microsoft Copilot mit 67 Prozent und ChatGPT mit 65 Prozent. Schlusslicht war Meta AI mit lediglich 54 Prozent richtigen Antworten und damit deutlich unter dem Spitzentrio.

Typische Fehlerquellen

Der Test zeigte mehrere wiederkehrende Problemtypen in den Antworten der Chatbots.

  • Falsche Fakten: Etwa fehlerhafte Angaben zu Steuerfreibeträgen, Versicherungsregeln oder Entschädigungen bei Reisen.
  • Unvollständige Ratschläge: Wichtige Details fehlten, etwa regionale Unterschiede im Recht oder spezielle Voraussetzungen bei Verbraucherrechten.
  • Übertriebene Sicherheit: Antworten wirkten oft sehr überzeugend formuliert, obwohl sie inhaltlich lückenhaft oder schlicht falsch waren.
  • Fehlende Kontextanpassung: Manche Systeme berücksichtigten Besonderheiten des britischen Rechts oder der britischen Steuergesetze nicht korrekt.

Gerade bei Finanz‑ und Rechtsfragen kritisiert Which?, dass manche Chatbots Empfehlungen geben, die Nutzer zu Verstößen gegen Vorschriften verleiten könnten, etwa bei Investments oder Steuerfragen.

Einordnung durch die Verbraucherorganisation

Which? sieht in KI‑Chatbots ein praktisches Werkzeug für erste Informationen, warnt aber vor blindem Vertrauen. Nach Einschätzung der Experten eignen sich die Systeme als Einstieg in komplexe Themen, ersetzen aber weder professionelle Beratung noch sorgfältige Eigenrecherche – insbesondere bei Geldanlage, Steuern, Versicherungen, Gesundheitsfragen und rechtlichen Streitigkeiten.

Die Organisation fordert strengere Standards und klare Regeln, wenn KI im Umfeld von Finanz‑ und Rechtsberatung eingesetzt wird, inklusive Transparenz, Prüfbarkeit der Empfehlungen und menschlicher Kontrolle. Verbraucher sollten KI‑Antworten immer mit offiziellen Quellen, Beratungsstellen oder Fachleuten abgleichen, bevor sie wichtige Entscheidungen treffen.

Seite teilen