Der Minitab Blog

Diskrepanzen bei der Groß- und Kleinschreibung in Excel-Daten schnell in Minitab korrigieren

Geschrieben von Cody Steele | 31.12.2021 08:41:04

Heutzutage ist es nicht ungewöhnlich, dass Dateneingabefehler in Datensätzen vorliegen, die so groß sind, dass diese Fehler nicht mehr von Hand gesucht und korrigiert werden können. Glücklicherweise enthält Minitab Werkzeuge, die es einfach machen, Ihre Daten aufzubereiten, damit Sie mit der Analyse fortfahren können.

Angenommen, Sie schauen sich die globale Holzdichtedatenbankan. Dies ist eine spannende Auskunftsquelle, wenn Sie Interesse an Holzdichten haben. Chave et al. haben sie als „die bisher größte Sammlung von Holzdichtedaten mit 8412 Taxa, 1683 Gattungen und 191 Familien“ (2009) bezeichnet. Auf datadryad.org wird diese Sammlung freundlicherweise als Excel-Datei zur Verfügung gestellt.


Wie sich herausstellt, gibt es in der Spalte „Region“ einen geringfügigen Fehler (zumindest zum Zeitpunkt der Veröffentlichung dieses Beitrags). Wahrscheinlich würden Sie es nicht einmal bemerken, aber es liegt eine Diskrepanz bei der Groß- und Kleinschreibung vor. Insgesamt 4182 Zeilen enthalten als Region „South America (tropical)“, während 9 Zeilen des Datensatzes als Region „South America (Tropical)“ enthalten. Eine derartige Situation kann zu Problemen in Ihrer Analyse führen. Falls Sie vermuten, dass ein Fehler dieser Art vorhanden ist, oder einfach sicherstellen möchten, dass dem nicht so ist, wäre es wirklich mühselig, 4191 Datenzeilen auf solche Diskrepanzen zu prüfen.

Glücklicherweise können Sie diese auch durch Auszählen in Minitab finden.

 

Kostenlose E-Learning-Ressource Minitab Quick Start™! Ohne Kreditkarte anmelden

 

Finden

  1. Wählen Sie Statistik > Tabellen > Einzelne Variablen auszählen aus.
  2. Geben Sie im Feld Variablen die Variable Region ein. Klicken Sie auf OK.

Die Diskrepanz bei der Groß- und Kleinschreibung lässt sich unten in der Ausgabetabelle erkennen.

BEHEBEN

In Minitab ist es ganz einfach, Diskrepanzen bei der Groß- und Kleinschreibung zu beseitigen. Versuchen Sie Folgendes:

  1. Wählen Sie Daten > Neu kodieren > In Text aus.
  2. Geben Sie im Feld Werte in den folgenden Spalten neu kodieren die Spalte Region ein.
  3. Wählen Sie im Feld Methode die Option Einzelwerte neu kodieren aus.
  4. Blättern Sie in der eingeblendeten Tabelle nach unten, um die Diskrepanz bei der Groß- und Kleinschreibung zu finden. Ändern Sie dann in der Spalte Neu kodierter Wert den Eintrag South America (Tropical), sodass jetzt ein kleingeschriebenes t verwendet wird.
  5. Wählen Sie im Feld Speicherort für neu kodierte Spalten die Option In den ursprünglichen Spalten aus. Klicken Sie auf OK.

In der Zusammenfassung wird gezeigt, dass 9 Vorkommen geändert wurden.

BEHEBEN, NOCH BEVOR ES ZUM PROBLEM WIRD

Beim Öffnen von Excel-Dateien kann Minitab Diskrepanzen bei der Groß- und Kleinschreibung beheben, noch bevor Sie wissen, dass diese ein Problem sind. Wenn Sie die globale Holzdichtedatenbank gespeichert haben und sie in Minitab öffnen, werden Optionen zum Öffnen einer Excel-Datei angezeigt. Versuchen Sie Folgendes:

  1. Wählen Sie Datei > Öffnen aus, und wählen Sie dann in Ihrem Dateisystem die Excel-Datei aus.
  2. Klicken Sie auf die Registerkarte Data. Dies ist der Name des Arbeitsblatts mit den Daten in der ursprünglichen Excel-Datei.
  3. Wählen Sie Daten enthalten Spaltennamen aus.
  4. Klicken Sie auf Optionen.
  5. Wählen Sie unter Textspalten die Option Diskrepanzen bei Groß-/Kleinschreibung korrigieren aus. Klicken Sie zweimal auf OK.

Wenn Sie jetzt die Spalte „Region“ auszählen, sehen Sie, dass die Spalte bereits korrigiert wurde.

ZUM ABSCHLUSS

Um Antworten aus Ihren Daten erhalten zu können, müssen die Daten selbst sauber genug sein, damit sie analysiert werden können. Minitab bietet eine Reihe von Werkzeugen, mit denen Sie Ihre Daten schneller aufbereiten und sich darauf konzentrieren können, Einblicke zu gewinnen. Bereit für mehr? Lesen Sie 3 Tipps zum Importieren von Daten aus Excel in Minitab.

LITERATURHINWEISE

Chave J, Coomes DA, Jansen S, Lewis SL, Swenson NG, Zanne AE (2009). Towards a worldwide wood economics spectrum. Ecology Letters 12(4): 351-366. http://dx.doi.org/10.1111/j.1461-0248.2009.01285.x

Zanne AE, Lopez-Gonzalez G, Coomes DA, Ilic J, Jansen S, Lewis SL, Miller RB, Swenson NG, Wiemann MC, Chave J (2009). Data from: Towards a worldwide wood economics spectrum. Dryad Digital Repository. http://dx.doi.org/10.5061/dryad.234

Sie haben Daten in einer XLSX- oder CSV-Datei und müssen sie in Minitab richtig strukturieren? Wir können Ihnen helfen. Probieren Sie die Schritte in diesem kostenlosen ebook aus:
Leitfaden zum Importieren und Vorbereiten Ihrer Excel-Daten in der Minitab Statistical Software
.