Was ist ein Liniendiagramm?

Ein Liniendiagramm (auch Liniendiagramm, Liniendiagramm genannt) verwendet Punkte, die durch Liniensegmente von links nach rechts verbunden sind, um Wertänderungen zu demonstrieren. Die horizontale Achse zeigt einen kontinuierlichen Verlauf, häufig den der Zeit, während die vertikale Achse Werte für eine Metrik von Interesse über diesen Verlauf meldet.

Das obige Liniendiagramm zeigt den Wechselkurs zwischen zwei fiktiven Währungen über einen Zeitraum von sechs Monaten., Im Laufe der Zeit von links nach rechts verbinden Punkte die täglichen Wechselkurse. Wir können aus der allgemeinen Steigung der Linie und ihren vertikalen Positionen ablesen, dass sich die Rate zwischen März und Anfang April von etwa 0,75 auf 0,78 verbesserte und dann Ende Mai und Juni allmählich auf etwa 0,765 sank.

Wenn Sie ein Liniendiagramm verwenden

Sie verwenden ein Liniendiagramm, wenn Sie Wertänderungen für eine Variable (auf der vertikalen Achse) für kontinuierliche Werte einer zweiten Variablen (auf der horizontalen) hervorheben möchten., Diese Betonung von Veränderungsmustern wird durch Liniensegmente bestimmt, die sich konsistent von links nach rechts bewegen und die Neigungen der Linien beobachten, die sich nach oben oder unten bewegen.

Auf der horizontalen Achse benötigen Sie eine Variable, die kontinuierliche Werte mit einem regelmäßigen Messintervall darstellt. Sehr häufig ist diese Variable eine zeitliche, die jede Minute, Stunde, Tag, Woche oder Monat eine Beobachtung erzeugt. Die Wahl der Intervallgröße oder bin ist eine Entscheidung, die der Analyst normalerweise für die Daten treffen muss, anstatt ein inhärentes Datenmerkmal zu sein.,

Auf der vertikalen Achse melden Sie den Wert einer zweiten numerischen Variablen für Punkte, die in jedem der von der horizontalen Achsenvariablen definierten Intervalle fallen. Oft ist dies eine statistische Zusammenfassung wie ein Gesamt-oder Durchschnittswert für Ereignisse in jedem Bin.

Mehrere Linien können auch in einem einzigen Liniendiagramm gezeichnet werden, um den Trend zwischen Serien zu vergleichen. Ein häufiger Anwendungsfall hierfür ist die Beobachtung der Aufschlüsselung der Daten über verschiedene Untergruppen hinweg. Die Möglichkeit, mehrere Linien zu zeichnen, bietet dem Liniendiagramm auch einen speziellen Anwendungsfall, in dem es normalerweise nicht ausgewählt wird., Normalerweise würden wir ein Histogramm verwenden, um die Frequenzverteilung einer einzelnen numerischen Variablen darzustellen. Da es jedoch schwierig ist, zwei Histogramme auf demselben Achsensatz zu zeichnen, dient das Liniendiagramm als guter Vergleichsmodus als Ersatz. Liniendiagramme, die zur Darstellung von Frequenzverteilungen verwendet werden, werden häufig als Frequenzpolygone bezeichnet.

Dieses Liniendiagramm zeigt, dass es viel mehr Abonnentenreisen als Gäste gibt, aber Gäste neigen dazu, im Durchschnitt längere Reisen zu unternehmen.,ure

Date Guests Subscribers
2019-05-01 19 103
2019-05-02 22 105
2019-05-03 20 98
2019-05-04 26 83

To use a line chart, data often needs to be aggregated into a table with two or more columns., Werte in der ersten Spalte geben Positionen für Punkte auf der horizontalen Achse für jede zu zeichnende Linie an. Jede folgende Spalte gibt die vertikale Position für Punkte einer einzelnen Linie an.

Bestimmte Tools erstellen Liniendiagramme aus einem anderen Datenformat, in dem drei Spalten erwartet werden, unabhängig davon, wie viele Zeilen gezeichnet werden sollen. In diesen Fällen geben die Spalten die horizontalen Werte und vertikalen Werte an, und welcher Zeile jede Zeile zugewiesen wird.,/th>

2019-03-01 Guest 23 2019-03-01 Subscriber 102 2019-03-02 Guest 24 2019-03-03 Subscriber 77 … … …

Best practices for using a line chart

Choose an appropriate measurement interval

An important aspect of creating a line chart is selecting the right interval or bin size., Bei zeitlichen Daten kann eine zu Breite eines Messintervalls bedeuten, dass es zu lange dauert, um zu sehen, wohin der Datentrend führt, wodurch das nützliche Signal ausgeblendet wird. Auf der Kehrseite der Medaille kann ein zu kurzes Messintervall nur Rauschen und nicht Signal anzeigen.

Das Testen verschiedener Intervalle oder das Verlassen Ihres Domänenwissens darüber, welche Daten aufgezeichnet werden, kann Sie über eine gute Auswahl der Bin-Größe informieren. Es kann auch möglich sein, mehrere Zeilen zu verwenden, wobei eine Zeile für ein feinkörniges Intervall und dann eine zweite Zeile für den Gesamttrend über ein rollendes Fenster gemittelt wird.,

Zeichnen Sie nicht zu viele Zeilen

Mit großer Leistung und großer Verantwortung, obwohl es die technische Fähigkeit gibt, viele Zeilen auf ein einzelnes Liniendiagramm zu setzen, ist es eine gute Idee, in der Datenmenge, die Sie zeichnen, vernünftig zu sein. Eine gute Faustregel ist, sich auf fünf oder weniger Zeilen zu beschränken, damit die Handlung nicht wie ein unlesbares Gewirr aussieht. Wenn die Zeilen jedoch gut getrennt sind, können Sie weiterhin alle Werte zeichnen, die Sie verfolgen möchten.,

Wenn Sie feststellen, dass mehr Zeilen als in einer einzelnen Achse gelesen werden können, können Sie die Diagramme in ein Raster kleinerer Liniendiagramme facettieren. Es wird schwieriger sein, Details in diesen Diagrammen zu sehen, daher ist es eine gute Idee, sie nach wichtigen Merkmalen (wie Durchschnitt oder Endwert) zu sortieren, um wichtige Punkte zu ermitteln. Wenn Sie ein Werkzeug verwenden, das interaktive Diagramme ermöglicht, besteht eine andere Alternative darin, einzelne Linien hervorzuheben oder Linien auszugrauen, die nach Belieben unscharf sind.,

Häufige Missbräuche

Strikte Verwendung einer Nullwert-Baseline

Obwohl die Null-Baseline für die vertikale Achse eine Voraussetzung für Balkendiagramme und Histogramme ist, müssen Sie keine Null-Baseline für ein Liniendiagramm einfügen. Denken Sie daran, dass das Hauptziel eines Liniendiagramms darin besteht, Wertänderungen und nicht die Größe der Werte selbst hervorzuheben. In Fällen, in denen eine Nulllinie nicht sinnvoll oder nützlich ist, ist es in Ordnung, den vertikalen Achsenbereich in den Bereich zu zoomen, der die Wertänderungen am aussagekräftigsten macht.,

Es gibt einen Anwendungsfall, in dem jedoch noch eine Null-Baseline erforderlich ist. Wenn ein Liniendiagramm zur Anzeige von Frequenzverteilungen verwendet wird, wird es in einer Kapazität verwendet, die Balkendiagrammen und Histogrammen entspricht. Daher folgt es der gleichen Anforderung, eine Nullwert-Baseline als Anker für die Höhen des Liniendiagramms enthalten zu müssen.,

Fehler beim Erkennen ungleichmäßiger Lücken zwischen Punkten

Wenn im Liniendiagramm Informationen für bestimmte Behälter fehlen, können Lücken im Datensatz als Phantomwerte interpretiert werden, wenn die Linie bei jeder Beobachtung keine eindeutigen Punkte enthält. Wenn nicht viele Punkte zu zeichnen sind, versuchen Sie, alle Punkte und nicht nur die Linie anzuzeigen. Wenn das Einbeziehen der Punkte die Interpretierbarkeit des Diagramms durcheinander bringen würde, besteht eine andere Alternative darin, eine Lücke in die Linie aufzunehmen, um anzuzeigen, wo Werte fehlen.,

Interpolieren einer Kurve zwischen Punkten

In einem Standardliniendiagramm ist jeder Punkt mit dem nächsten mit einem geraden Segment verbunden, vom ersten bis zum letzten. Es kann jedoch die ästhetische Versuchung bestehen, alle Punkte reibungslos zu verknüpfen und eine Kurve anzupassen, die alle Punkte gleichzeitig durchläuft. Sie sollten dieser Versuchung absolut widerstehen! Wie im folgenden Beispiel zu sehen ist, wird beim Versuch, diese Art der Anpassung durchzuführen, sichergestellt, dass die Wahrnehmung der Trends in den Daten verzerrt wird., Die Richtung und Steilheit der Linie soll auf eine Wertänderung hinweisen, und so kann die Kurve das Vorhandensein zusätzlicher Datenpunkte zwischen den tatsächlichen Messungen implizieren, die nicht existieren.

Unter Verwendung einer irreführenden Doppelachse

Beispiele für Liniendiagramme mit mehreren Zeilen hatten bisher jede Zeile Teil derselben Domäne und können somit auf derselben Achse gezeichnet werden. Es gibt jedoch nichts, was jede Zeile darauf beschränkt, Werte für dieselben Einheiten darzustellen., Wenn ein Liniendiagramm zwei Reihen enthält, die jeweils eine Zusammenfassung einer anderen Variablen darstellen, erhalten wir ein zweiachsiges Diagramm.

Das Problem bei einem zweiachsigen Diagramm besteht darin, dass es leicht manipuliert werden kann, um irreführend zu sein. Abhängig davon, wie jede Achse skaliert wird, kann die wahrgenommene Beziehung zwischen den beiden Linien geändert werden. In den beiden folgenden Diagrammen wird die Anzahl der wöchentlichen Versuche und Abonnements in zweiachsigen Diagrammen dargestellt. Die Daten sind für jede genau gleich, aber aufgrund der Wahl der vertikalen Skalierung für jede Variable ändert sich die abgeleitete Beziehung zwischen den Variablen.,

Während viele Visualisierungstools in der Lage sind, zweiachsige Diagramme zu erstellen, schlagen gängige Empfehlungen dagegen vor, unabhängig davon, ob sich die beiden Achsen in denselben oder separaten Domänen befinden. Stattdessen ermöglicht die Facettierung der beiden Zeilen in separate Diagramme immer noch, dass die allgemeinen Veränderungsmuster für beide Variablen beobachtet werden, während die Versuchungen, sie auf irreführende Weise zu vergleichen, verringert werden.,

Allgemeine Liniendiagrammoptionen

Fügen Sie zusätzliche Zeilen hinzu, um Unsicherheit anzuzeigen

Wenn wir eine Zeile haben, die eine statistische Zusammenfassung wie einen Durchschnitt oder Median darstellt, können wir auch eine Option zum Diagramm hinzufügen, um Unsicherheit oder Variabilität in den Daten an jedem gezeichneten Punkt anzuzeigen. Eine Möglichkeit, dies zu tun, besteht darin, an jedem Punkt Fehlerbalken hinzuzufügen, um die Standardabweichung oder ein anderes Unsicherheitsmaß anzuzeigen. Eine andere Alternative besteht darin, unterstützende Zeilen über oder unter der Zeile hinzuzufügen, um bestimmte Grenzen für die Daten anzuzeigen., Diese Zeilen können als Schattierung gerendert werden, um die gängigsten Datenwerte anzuzeigen, wie im folgenden Beispiel.

Sparkline

Ein besonderer Fall für das Liniendiagramm ist die sparkline. Eine Sparkline ist im Wesentlichen ein kleines Liniendiagramm, das so erstellt wurde, dass es mit Text oder neben vielen Werten in einer Tabelle in Einklang steht. Aufgrund seiner geringen Größe enthält es keine Kennzeichnung. Statistiken können neben der Sparkline platziert werden, um Start-und Endwerte oder möglicherweise minimale oder maximale Werte anzuzeigen., Der Hauptpunkt einer Sparkline besteht darin, Veränderungen über einen bestimmten Zeitraum zu zeigen, und wird oft in finanziellen Kontexten gesehen.

Ridgeline plot

Eine Variante Diagrammtyp für ein Liniendiagramm mit mehreren Linien ist die ridgeline plot. In einem Ridgeline-Plot wird jede Linie auf einer anderen Achse aufgetragen, die vertikal leicht versetzt ist. Dieser leichte Versatz kann im Vergleich zu einer vollständigen Facettierung von Grundstücken Platz sparen. Wie die Sparkline werden vertikale Achsenmarkierungen normalerweise vermieden: Es wäre schwierig, diese Werte auf den verschiedenen Achsen zu lesen., Ridgeline-Diagramme werden hauptsächlich verwendet, um viele Gruppen anhand ihrer Frequenzverteilungen zu vergleichen. Dies ist am nützlichsten, wenn ein klares Muster sichtbar ist, wenn die Linien in irgendeiner Weise geordnet sind.

Balkendiagramm

Wenn die Variable, die wir auf der horizontalen Achse anzeigen möchten, nicht numerisch oder geordnet, sondern kategorial ist, müssen wir anstelle eines Liniendiagramms ein Balkendiagramm verwenden. Die Balken in einem Balkendiagramm sind normalerweise durch kleine Lücken getrennt, die dazu beitragen, die diskrete Natur der gezeichneten Kategorien hervorzuheben., Beachten Sie jedoch, dass wir, wenn unsere horizontale Achse numerisch oder geordnet ist, nicht darauf beschränkt sind, ein Balkendiagramm zu verwenden, wie im folgenden Beispiel gezeigt.

Links: Balkendiagramm über kategoriale Gruppen. Rechts: Balkendiagramm über zeitliche Gruppen.

Punktdiagramm

Ein anderer Diagrammtyp, den wir verwenden können, wenn die Variable horizontale Achse kategorisch ist, ist das Punktdiagramm oder das Punktdiagramm. Das Punktdiagramm ähnelt einem Liniendiagramm, mit der Ausnahme, dass keine Liniensegmente aufeinanderfolgende Punkte verbinden., Dieser Mangel an Liniensegmenten befreit die Punkte von ihrer sequentiellen Progression, und so kann die Reihenfolge der Beschriftungen und Punkte wie ein Balkendiagramm frei eingestellt werden. Der Hauptvorteil der Verwendung eines Punktdiagramms gegenüber einem Balkendiagramm besteht darin, dass ein Punktdiagramm, wie ein Liniendiagramm, nicht dazu verpflichtet ist, eine Nulllinie einzuschließen. Wenn wir Werte über Ebenen einer kategorialen Variablen haben, zugeordnete Werte jedoch keine aussagekräftige Null-Baseline haben, kann das Punktdiagramm eine gute Diagrammtypoption sein.,

Histogramm

Wenn die vertikale Achse eines Liniendiagramms Informationen über eine Frequenzverteilung darstellt, haben wir stattdessen die Möglichkeit, die Daten als Histogramm zu visualisieren. Einer der Hauptvorteile des Histogramms besteht darin, dass die Balken eine konsistentere Anzeige der Frequenz in jedem Behälter darstellen. Frequenzurteile können in einem Liniendiagramm irreführend sein, insbesondere in den Spitzen und Trögen einer Verteilung., Ein Liniendiagramm hat jedoch einen Vorteil für die Visualisierung von Frequenzverteilungen: Wenn wir zwei verschiedene Gruppen vergleichen müssen, ist dies für ein Histogramm sehr schwierig. Wie in einem früheren Abschnitt bei Verwendung eines Liniendiagramms zu sehen ist, können wir die Linien der beiden Gruppen mit geringem Problem einfach auf denselben Achsen darstellen.

Dichtekurve

Eine weitere Alternative für frequenzbasierte Liniendiagramme ist die Dichtekurve oder Kernel density estimate (KDE)., Während ein Liniendiagramm Frequenzzählungen nach Bins zu einzelnen Punkten aggregiert, aggregiert das KDE den Beitrag jedes Punktes kontinuierlich. In einem KDE trägt jeder Punkt einen kleinen Volumenklumpen bei, der um seinen wahren Wert (den Titelkern) zentriert ist; Die Summe aller Volumina ergibt die endgültige Dichtekurve. Da es so viele Optionen für die Form des Kernels gibt, ist die Schätzung der Kerndichte normalerweise für programmatische Ansätze zur Datenvisualisierung reserviert.,

Flächendiagramm

Eine Erweiterung des Liniendiagramms beinhaltet das Hinzufügen von Schattierungen zwischen der Linie und einer Nulllinie, die als Flächendiagramm bezeichnet wird. Das Flächendiagramm kann als Hybrid des Liniendiagramms mit dem Balkendiagramm betrachtet werden, da Werte nicht nur aus ihren vertikalen Positionen, sondern auch aus der Größe des schattierten Bereichs zwischen jedem Punkt und der Basislinie gelesen werden können.,

Verbundenes Streudiagramm

Wenn Sie zwei Werteserien haben, die Sie mit einem Liniendiagramm zeichnen möchten, ist ein alternativer Diagrammtyp das verbundene Streudiagramm. In einem Standardstreudiagramm stellen die beiden Achsen zwei interessierende Variablen dar, und auf den Achsen aufgezeichnete Punkte geben Werte für diese Variablen an. Wenn wir Punkte in einer Reihenfolge verbinden, die durch eine dritte Variable wie time angegeben wird, erhalten wir ein verbundenes Streudiagramm., Ein verbundenes Streudiagramm eignet sich gut, um nicht nur die Beziehung zwischen zwei Variablen zu betrachten, sondern auch, wie sie sich über die Zeit oder die Werte einer dritten Variablen ändern.

Das verbundene Streudiagramm (unten rechts) ist eine Kombination aus zwei Liniendiagrammen (oben rechts, unten links). Beachten Sie die vertauschten Achsen für das obere rechte Diagramm.

Visualisierungstools

Das Liniendiagramm ist ein vielseitiger und nützlicher Diagrammtyp und sollte daher in so ziemlich jedem von Ihnen gewählten Datenvisualisierungstool verfügbar sein., Grundlegende Liniendiagramme, in denen eine oder mehrere Linien auf einer einzelnen Achse gezeichnet sind, sollten üblich sein, aber erweiterte Optionen wie Doppelachsen sind möglicherweise nicht vorhanden oder erfordern zusätzliche Datenarbeit zum Einrichten. Die Ridgeline-Variante ist keine gängige integrierte und erfordert normalerweise benutzerdefinierte Programmierung oder ein benutzerdefiniertes Paket zum Erstellen. Sparklines sind auch nicht üblich, auf ihre eigenen, und werden häufiger als eingebaut als Teil anderer Reporting-Tools gesehen.

Das Liniendiagramm ist einer von vielen verschiedenen Diagrammtypen, die zur Visualisierung von Daten verwendet werden können., Erfahren Sie mehr aus unseren Artikeln über wesentliche Diagrammtypen, die Auswahl einer Art von Datenvisualisierung oder durch Durchsuchen der vollständigen Artikelsammlung in der Kategorie Diagramme.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.