Ich habe den vorgegebenen Datensatz „Beispieldatensatz_Vertriebszahlen.xlsx“ mir angeschaut. Meine erste Datensichtung endete mit einer Pivot-Tabelle mit einem recht sinnfreien Pivot-Diagramm. Bei so einem Datensatz wäre das für mich eine gängige erste Herangehensweise.
Ich habe den Datensatz sowohl in ChatGPT als auch in Perplexity hochgeladen und beiden Tools folgenden Prompt mitgegeben:
„Was beschreiben die Daten.
Was fällt dir bei den Daten auf?
Analysiere die Daten vollständig.
Würdest du die Daten nach Regionen oder nach Produkten analysieren?
Erkennst du ein Muster in den Daten?
Siehst du Abhängigkeiten zwischen einzelnen Produkten?
Ist ein Trend zu erkennen?
Welche Aussage zu den Daten würdest du treffen?
Stelle die wichtigsten Erkenntnisse grafisch da.
Erstelle eine PDF-Datei mit allen Erkenntnissen“
Beide KI-Tools machten sich sofort an die Arbeit. Es wurden Erkenntnisse formuliert , deskriptive Statistiken erstellt usw..
ChatGPT:
ChatGPT schien einem Muster zu folgen, wie es die Daten analysiert hatte.
Sehr schön strukturiert. Es wurden einige statistische Kennwerte ermittelt und viele Aussagen formuliert wie z.B. „die Entwicklung der Produkte verlaufen parallel- besonders zwischen A & B“.
Für eine gewünschte PDF-Zusammenfassung haben meine Credits bei ChatGPT offensichtlich nicht mehr ausgereicht.

Perplexity:
Perplexity analysierte den Datensatz ähnlich wie ChatGPT. Es wurden jedoch mehr statistische Zahlen ermittelt wie z.B. die Standardabweichungen. Sehr stark finde ich, dass für eine grafische Darstellung Vorschläge gemacht werden. Perplexity schlägt ein Liniendiagramm für den Wachstumstrend als auch ein Balkendiagramm für regionale Durchschnittsvergleiche vor.

Fazit. Die Mächtigkeit der KI-Tools stelle ich nicht in Frage. Für diesen trivialen Fall der Verkaufszahlen, kann ich die Auswertungen beider Tools sehr schnell nachvollziehen.
Aber gerade bei diesem Beispiel kann man auch schön sehen, dass die menschliche Intuition fehlt. Kein Tool stellte die Daten in Frage. Ich hingegen habe direkt an der Sinnhaftigkeiten einer Auswertung gezweifelt. Es ist zu erkennen, dass es ein künstlicher Datensatz ist. Beispielsweise werden die einzelnen Produkte jeweils immer nur in 3 von 12 Monaten (und das auch regional abhängig) verkauft. Ohne eine gute Begründung, würde ich erstmals nach einer Ursache forschen, um mir Klarheit über die Datenlage zu verschaffen.