DeuAq.com >> Leben >  >> Elektronik

So normalisieren Sie Daten in Google Tabellen

Wenn Sie mit größeren Datensätzen in Google Tabellen arbeiten, kann das Vergleichen von Variablenwerten ein langwieriger Prozess sein. Glücklicherweise ist die Normalisierung eine statistische Methode, mit der Sie komplizierte Werte in einfach zu vergleichende Datensätze sortieren können.

In diesem Artikel wird erklärt, was Normalisierung ist und wie Sie Daten in Google Tabellen für statistische Vorteile normalisieren können.

So normalisieren Sie Daten in Google Tabellen

Angenommen, wir haben einige numerische Werte in Zellen, die von A2 bis A50 reichen. Um diesen Bereich in Werte zwischen X und Y zu normalisieren, müssen Sie Folgendes tun:

Wenn sich Ihr erster Datenpunkt in A2 befindet, kann der erste normalisierte Wert mithilfe dieser Formel ermittelt werden:

(Y-X)*((A2-MIN($A$2:$A$50))/(MAX($A$2:$A$50)-MIN($A$2:$A$50)))+Y

Verwenden Sie direkt die Zahlenwerte für X und Y.
So normalisieren Sie Daten in Google Tabellen
Sobald Sie die Formel für die erste Zahl eingegeben haben, bewegen Sie den Mauszeiger zum unteren Rand der Zelle, bis er zu einem Kreuz wird. Drücken und ziehen Sie dann den Cursor nach unten, um die verbleibenden Zeilen mit der Formel zu füllen. Google Sheets ersetzt A2 automatisch durch die entsprechende Zeilennummer für die verbleibenden Zellen, während sich alles hinter $-Symbolen nicht ändert.
So normalisieren Sie Daten in Google Tabellen
Wenn Sie auf die Werte von X und Y aus anderen Zellen in den Blättern verweisen möchten, müssen Sie $s vor die Zeile und Spalte der Zellen setzen, in denen sich die Werte befinden (z. B. $D $5), oder das Kopieren der Formel kann zu einem Parsing-Fehler oder falschen Ergebnissen führen.
So normalisieren Sie Daten in Google Tabellen
Ihre Daten werden nun zwischen X- und Y-Werten normalisiert.
So normalisieren Sie Daten in Google Tabellen

Das Normalisieren Ihrer Daten ist eine großartige Möglichkeit, die Unterschiede zwischen zwei Datensätzen mit unterschiedlichen Mindest- und Höchstwerten zu messen.

So verwenden Sie Google Tabellen als Datenbank

Jede Datenbank ist im Wesentlichen eine große Tabelle (oder viele verbundene Tabellen), die von einem Datenbankverwaltungssystem verwaltet wird. Wenn Sie mit einem relativ kleinen Datensatz arbeiten, der nicht zu stark skaliert werden muss, kann Google Sheets als Ihre Datenbank verwendet werden.

Wenn Sie Google Sheets als Datenbank verwenden möchten, müssen Sie über Grundkenntnisse in der Programmierung verfügen. Sie benötigen außerdem eine API, um das Blatt mit SQL und Python kompatibel zu machen. Obwohl Google eine umfassende API für seine Dienste anbietet, könnte es ein bisschen zu viel sein, damit umzugehen. Daher empfehlen wir sheet2api oder Autocode, um den API-Bedarf zu lösen. Die API-Dienste stellen die Verbindung und Authentifizierungen bereit, die erforderlich sind, um Ihre Google-Tabellen als Ihre Datenbank zu verbinden, und bieten ausreichend Endpunkte, um einen ordnungsgemäßen Datenbank-Workflow zu ermöglichen.

Der Hauptvorteil der Verwendung von Google Sheets als Datenbank besteht darin, dass Sie jederzeit einen visuellen Überblick über alle Daten haben. Da Google Sheets als App für Mobilgeräte verfügbar ist und mit den meisten Browsern und Betriebssystemen kompatibel ist, kann von überall auf der Welt auf Ihre Datenbank zugegriffen werden. Sie können Daten auch direkt im Blatt selbst anzeigen und bearbeiten, anstatt Code zu verwenden, um eine Abfrage durch die Datenbank zu führen, um Änderungen vorzunehmen.

Google Sheets hat jedoch seine Einschränkungen bei der Datenbankverwaltung. Zum einen gibt es einen deutlichen Mangel an relationalen Funktionen. Datenbanken bestehen normalerweise aus vielen Tabellen, die Fremdschlüssel verwenden, um miteinander zu kommunizieren, ein Prozess, der in einer einzelnen Tabelle einfach nicht vorhanden ist.

Wenn Sie sich ein Beispiel ansehen möchten, betrachten Sie die Abteilungen in Ihrem Unternehmen. In einer Tabellenkalkulation wären dies normalerweise nur getippte Zeichenfolgen. Dies ist jedoch für einen größeren Datensatz unklug. In Datenbanken hätten Sie eine separate Tabelle für Unternehmensabteilungen, wobei jede Abteilung entsprechend nummeriert wäre. Sie würden dann die Nummer der Abteilung in den Daten über einen Mitarbeiter mit einem Fremdschlüssel referenzieren. Mit einer separaten Abteilungstabelle können Sie direkte Änderungen an den Abteilungen selbst vornehmen, ohne die Änderungen durch die gesamte Datenbank laufen zu lassen.

Außerdem kann Google Sheets nur fünf Millionen Zellen gleichzeitig speichern. Auch wenn dies wie eine große Zahl erscheinen mag, können selbst mittelständische Unternehmen Datenbanken haben, die diese Grenze weit überschreiten. Darüber hinaus treten Leistungsprobleme viel schneller auf, bevor Sie das Zellenlimit erreichen. Bei einer scheinbar linearen Skalierung zwischen der Anzahl der Zellen und der Leistung treten erhebliche Verzögerungen auf, wenn Sie mit einer Datenbank arbeiten, die 100.000 Zellen enthält.

Zusätzliche FAQ

Können Sie Daten in Google Tabellen einfügen?

Mit der integrierten API von Google können Sie eine Tabelle direkt aus Dateien einfügen. Das Dateiimport-Tool unterstützt die folgenden Erweiterungen:

• .xls

• .xlsx

• .xlsm

• .xlt

• .xltx

• .xltm

• .ods

• .csv

• .txt

• .tsv

• .tab

Darüber hinaus verfügt Software von Drittanbietern normalerweise über Integrationen mit Google Sheets. Sheets2api und Autocode, die wir zuvor besprochen haben, verfügen beide über API-Lösungen, um das Einfügen von Daten in vorhandene Tabellen zu ermöglichen.

Sie können auch die IMPORTRANGE-Funktion verwenden, um Daten von einem Google-Blatt in ein anderes einzufügen.

Google bietet auch Skriptanweisungen zum Schreiben von Inhalten in eine Tabelle.

Wenn Sie eine für Sie geeignete API-Lösung finden, können Sie ganz einfach Daten in Google Sheets einfügen, sobald Sie es mit Ihrer Plattform verbunden haben.

Wie bereinige ich Daten in Google Tabellen?

Google Sheets bietet mehrere Lösungen zum Bereinigen und Sortieren von Daten.

Wenn Sie Google Formulare zum Erfassen von Umfrageergebnissen verwenden, können Sie Formulare so einrichten, dass Beantwortungen automatisch in eine Tabelle eingefügt werden, anstatt die Daten manuell einzufügen.

Google Sheets hat auch eine Datenvalidierungsfunktion. Wenn Sie zu Daten> Datenvalidierung gehen, können Sie Validierungsfunktionen einrichten, um falsche Werte zu verhindern. Beispielsweise können Sie eine Liste von Elementen erstellen, die in eine bestimmte Spalte eingefügt werden können, und der Versuch, etwas anderes einzufügen, führt zu einem Fehler.

Google Sheets hat auch die Optionen „Duplikate entfernen“ und „Leerzeichen kürzen“. Dadurch werden alle zusätzlichen Werte und Leerzeichen aus Ihren Zeilen und Zellen entfernt.

Wenn Sie besser organisierte Daten von Online-Seiten einfügen möchten, verwenden Sie IMPORTHTML oder IMPORTXML, um die benötigten Informationen von einer Webseite ohne zusätzliches Durcheinander zu erhalten.

Was bedeutet es, Daten zu normalisieren?

In der Statistik ermöglicht Ihnen die Normalisierung von Daten, verschiedene Datensätze vergleichbarer zu machen.

Wenn Sie Daten normalisieren, können Sie den ursprünglichen numerischen Wertebereich in einen Bereich Ihrer Wahl ändern. Beispielsweise können Sie verschiedene Scoring-Methoden auf denselben Wertebereich normalisieren, um sie miteinander zu vergleichen.

Das Normalisieren eines Wertes x, der aus einem Bereich (y,z) stammt, auf einen Bereich (a,b) erfolgt durch die folgende Formel:

X_normalisiert =(b – a) * ((x – y) / (z – y)) + a

Das Normalisieren von Daten ist nützlich, wenn Ihre ursprünglichen Datensätze keine sauberen Werte aufweisen. Beispielsweise kann die Standardisierung der Bereiche auf (0,100) helfen, einen schnellen Überblick über die Punktzahlen zu erhalten, unabhängig vom Maximalwert der Punktzahlen selbst.

Eine weitere statistische Methode der Datenauswertung ist die Standardisierung. Dadurch haben die ursprünglichen numerischen Werte einen Mittelwert von 0 und eine Standardabweichung von 1. Die standardisierten Werte werden oft als Z-Scores bezeichnet.

Google Sheets hat eine Funktion, mit der Sie einen Datensatz standardisieren können. Die Funktion STANDARDIZE(x, mean, standard_dev) bringt den numerischen Wert x in seine standardisierte Form. Sie können die Funktion AVERAGE(range) verwenden, um den Mittelwert Ihrer Daten in der Tabelle zu erhalten, und die Funktion ST_DEV(range) verwenden, um die Standardabweichung des Datensatzes zu berechnen.

Die Interpretation standardisierter Daten ist etwas anders. Beispielsweise bedeutet eine standardisierte Zahl von -1,5, dass der ursprüngliche Wert um das 1,5-fache der Standardabweichung des Satzes kleiner als der Durchschnitt ist.

Standardisierung kann nützlich sein, um die Werte verschiedener Datensätze mit unterschiedlichen Erwartungen und Mitteln zu vergleichen. Da bei einer Standardisierung der Mittelwert immer auf 0 und die Abweichung auf 1 gesetzt wird, stören die im Datensatz dargestellten tatsächlichen Werte den Vergleich nicht.

Die statistische Analyse kann auch einen Datensatz transformieren, um ihn an eine bestimmte Verteilung anzupassen, aber das ist eine fortgeschrittene statistische Funktion, die in diesem Leitfaden nicht behandelt wird.

Neue Normalität

Das Normalisieren von Datensätzen ist ein unglaublich nützliches Werkzeug bei der Datenanalyse, und Google Sheets bietet eine schnelle Lösung zum Normalisieren numerischer Daten. Darüber hinaus können Sie Google Sheets als kleine Datenbank verwenden, wenn Sie für Ihre Arbeit nicht mit außergewöhnlichen Mengen an Datensätzen arbeiten. Die Integrationen von Google Sheets mit Software von Drittanbietern machen es für eine Vielzahl von Branchen geeignet. Richtige Datenbanken sind jedoch viel besser skalierbar.

Welche Art von Informationen normalisieren Sie normalerweise in Google Tabellen? Verwenden Sie Google Sheets für Ihre Datenbank? Lassen Sie es uns im Kommentarbereich unten wissen.