Heutzutage ist es nicht ungewöhnlich, dass Dateneingabefehler in Datensätzen vorliegen, die so groß sind, dass diese Fehler nicht mehr von Hand gesucht und korrigiert werden können. Glücklicherweise enthält Minitab Werkzeuge, die es einfach machen, Ihre Daten aufzubereiten, damit Sie mit der Analyse fortfahren können.
Angenommen, Sie schauen sich die globale Holzdichtedatenbankan. Dies ist eine spannende Auskunftsquelle, wenn Sie Interesse an Holzdichten haben. Chave et al. haben sie als „die bisher größte Sammlung von Holzdichtedaten mit 8412 Taxa, 1683 Gattungen und 191 Familien“ (2009) bezeichnet. Auf datadryad.org wird diese Sammlung freundlicherweise als Excel-Datei zur Verfügung gestellt.
Wie sich herausstellt, gibt es in der Spalte „Region“ einen geringfügigen Fehler (zumindest zum Zeitpunkt der Veröffentlichung dieses Beitrags). Wahrscheinlich würden Sie es nicht einmal bemerken, aber es liegt eine Diskrepanz bei der Groß- und Kleinschreibung vor. Insgesamt 4182 Zeilen enthalten als Region „South America (tropical)“, während 9 Zeilen des Datensatzes als Region „South America (Tropical)“ enthalten. Eine derartige Situation kann zu Problemen in Ihrer Analyse führen. Falls Sie vermuten, dass ein Fehler dieser Art vorhanden ist, oder einfach sicherstellen möchten, dass dem nicht so ist, wäre es wirklich mühselig, 4191 Datenzeilen auf solche Diskrepanzen zu prüfen.
Glücklicherweise können Sie diese auch durch Auszählen in Minitab finden.
Kostenlose E-Learning-Ressource Minitab Quick Start™! Ohne Kreditkarte anmelden
Die Diskrepanz bei der Groß- und Kleinschreibung lässt sich unten in der Ausgabetabelle erkennen.
In Minitab ist es ganz einfach, Diskrepanzen bei der Groß- und Kleinschreibung zu beseitigen. Versuchen Sie Folgendes:
In der Zusammenfassung wird gezeigt, dass 9 Vorkommen geändert wurden.
Beim Öffnen von Excel-Dateien kann Minitab Diskrepanzen bei der Groß- und Kleinschreibung beheben, noch bevor Sie wissen, dass diese ein Problem sind. Wenn Sie die globale Holzdichtedatenbank gespeichert haben und sie in Minitab öffnen, werden Optionen zum Öffnen einer Excel-Datei angezeigt. Versuchen Sie Folgendes:
Wenn Sie jetzt die Spalte „Region“ auszählen, sehen Sie, dass die Spalte bereits korrigiert wurde.
Um Antworten aus Ihren Daten erhalten zu können, müssen die Daten selbst sauber genug sein, damit sie analysiert werden können. Minitab bietet eine Reihe von Werkzeugen, mit denen Sie Ihre Daten schneller aufbereiten und sich darauf konzentrieren können, Einblicke zu gewinnen. Bereit für mehr? Lesen Sie 3 Tipps zum Importieren von Daten aus Excel in Minitab.
Chave J, Coomes DA, Jansen S, Lewis SL, Swenson NG, Zanne AE (2009). Towards a worldwide wood economics spectrum. Ecology Letters 12(4): 351-366. http://dx.doi.org/10.1111/j.1461-0248.2009.01285.x
Zanne AE, Lopez-Gonzalez G, Coomes DA, Ilic J, Jansen S, Lewis SL, Miller RB, Swenson NG, Wiemann MC, Chave J (2009). Data from: Towards a worldwide wood economics spectrum. Dryad Digital Repository. http://dx.doi.org/10.5061/dryad.234