Co to jest wykres liniowy?

wykres liniowy (aka wykres liniowy, wykres liniowy) wykorzystuje punkty połączone segmentami liniowymi od lewej do prawej, aby zademonstrować zmiany wartości. Oś pozioma przedstawia ciągły postęp, często czas, podczas gdy oś pionowa zgłasza wartości dla metryki zainteresowania w całym tym postępie.

powyższy wykres pokazuje kurs wymiany między dwiema fikcyjnymi walutami w okresie sześciu miesięcy., W miarę upływu czasu od lewej do prawej, punkty łączą dzienne kursy walut. Z ogólnego nachylenia linii i jej pozycji pionowych wynika, że kurs poprawił się z około 0,75 do 0,78 między marcem a początkiem kwietnia, a następnie stopniowo spadał do około 0,765 na przełomie maja i czerwca.

kiedy powinieneś używać wykresu liniowego

będziesz używać wykresu liniowego, gdy chcesz podkreślić zmiany wartości dla jednej zmiennej (wykreślonej na osi pionowej) dla ciągłych wartości drugiej zmiennej (wykreślonej na osi poziomej)., Ten nacisk na wzorce zmian jest sprzedawany przez segmenty linii poruszających się konsekwentnie od lewej do prawej i obserwujących zbocza linii poruszających się w górę lub w dół.

na osi poziomej potrzebna jest zmienna, która przedstawia wartości ciągłe, które mają regularny odstęp między pomiarami. Bardzo często zmienna ta ma charakter czasowy, generując obserwację co minutę, godzinę, dzień, tydzień lub miesiąc. Wybór wielkości interwału, lub bin, jest decyzja, że analityk będzie zwykle musiał dokonać dla danych, a nie jest nieodłączną cechą danych.,

na osi pionowej zostanie podana wartość drugiej zmiennej liczbowej dla punktów, które mieszczą się w każdym z przedziałów zdefiniowanych przez zmienną osi poziomej. Często będzie to podsumowanie statystyczne, takie jak całkowita lub Średnia wartość wszystkich zdarzeń w każdym koszu.

wiele linii można również wykreślić na wykresie jednowierszowym, aby porównać trend między seriami. Powszechnym przypadkiem zastosowania tego jest obserwowanie podziału danych na różne podgrupy. Możliwość rysowania wielu linii zapewnia również wykresowi linii specjalny przypadek użycia, w którym zwykle nie może być wybrany., Zwykle używamy histogramu, aby przedstawić rozkład częstotliwości pojedynczej zmiennej numerycznej. Ponieważ jednak trudno jest narysować dwa histogramy na tym samym zestawie osi, wykres liniowy służy jako dobry sposób porównania jako substytut. Wykresy liniowe używane do zobrazowania rozkładu częstotliwości są często nazywane wielokątami częstotliwości.

ten wykres linii pokazuje, że jest o wiele więcej podróży Abonenta niż gości, ale goście mają tendencję do dłuższych podróży średnio.,ure
Date Guests Subscribers
2019-05-01 19 103
2019-05-02 22 105
2019-05-03 20 98
2019-05-04 26 83

To use a line chart, data often needs to be aggregated into a table with two or more columns., Wartości w pierwszej kolumnie wskazują pozycje punktów na osi poziomej dla każdej linii do wykreślenia. Każda kolejna kolumna wskazuje położenie pionowe dla punktów pojedynczej linii.

niektóre narzędzia tworzą wykresy liniowe z innego formatu danych, w którym oczekiwane są trzy kolumny niezależnie od liczby linii do wykresu. W takich przypadkach kolumny określają wartości poziome, pionowe i do którego wiersza zostanie przypisany wiersz.,/th> 2019-03-01 Guest 23 2019-03-01 Subscriber 102 2019-03-02 Guest 24 2019-03-03 Subscriber 77 … … …

Best practices for using a line chart

Choose an appropriate measurement interval

An important aspect of creating a line chart is selecting the right interval or bin size., W przypadku danych temporalnych zbyt szeroki odstęp między pomiarami może oznaczać, że zbyt długo trwa sprawdzenie, dokąd prowadzi trend danych, ukrywając użyteczny sygnał. Na odwrocie monety zbyt krótki interwał pomiarowy może ujawniać jedynie szum, a nie sygnał.

testowanie różnych interwałów lub poleganie na wiedzy domeny o tym, jakie dane są rejestrowane, może poinformować Cię o dobrym wyborze rozmiaru bin. Możliwe jest również użycie wielu linii, z jedną linią dla drobnoziarnistego interwału, a następnie drugą linią dla ogólnego trendu, uśredniając nad tocznym oknem.,

nie rysuj zbyt wielu linii

z wielką mocą wiąże się wielka odpowiedzialność, więc chociaż istnieje techniczna zdolność do umieszczenia wielu linii na jednym wykresie, dobrym pomysłem jest rozsądne w ilości danych, które wykreślasz. Dobrą zasadą jest ograniczenie się do pięciu lub mniej linii, aby fabuła nie wyglądała jak nieczytelna plątanina. Jeśli jednak linie są dobrze oddzielone, nadal można wykreślić wszystkie wartości, które chcesz śledzić.,

Jeśli okaże się, że trzeba narysować więcej linii niż można odczytać w jednej osi, możesz rozważyć podzielenie wykresów na siatkę mniejszych wykresów liniowych. Trudniej będzie zobaczyć szczegóły w tych działkach, więc dobrym pomysłem jest posortowanie ich według jakiejś ważnej cechy (takiej jak średnia lub końcowa wartość), aby pomóc wyciągnąć ważne punkty. Jeśli używasz narzędzia, które pozwala na interaktywne wykresy, inną alternatywą jest możliwość podświetlania pojedynczych linii lub szarych linii, aby nie były skupione zgodnie z życzeniem czytelnika.,

często popełniane błędy

ściśle używając linii bazowej o wartości zerowej

mimo że zerowa linia bazowa dla osi pionowej jest wymogiem dla wykresów słupkowych i histogramów, nie musisz dołączać zerowej linii bazowej dla wykresu liniowego. Przypomnijmy, że głównym celem wykresu liniowego jest podkreślenie zmian wartości, a nie wielkości samych wartości. W przypadkach, gdy linia zerowa nie jest znacząca lub użyteczna, dobrze jest powiększyć zakres osi pionowej do tego, co sprawi, że zmiany wartości będą najbardziej pouczające.,

istnieje jednak jeden przypadek użycia, w którym wciąż konieczna jest zerowa linia bazowa. Gdy wykres liniowy jest używany do wyświetlania rozkładów częstotliwości, a następnie jest używany w pojemności równoważnej wykresów słupkowych i histogramów. W związku z tym, będzie spełniać ten sam wymóg konieczności włączenia linii bazowej wartości zerowej jako kotwicy dla wysokości wykresu liniowego.,

Nie zidentyfikowanie nierównych odstępów między punktami

gdy na wykresie liniowym brakuje informacji dla pewnych koszy, luki w zapisie mogą być interpretowane jako wartości fantomowe, jeśli linia nie zawiera odrębnych kropek przy każdej obserwacji. Gdy nie ma zbyt wielu punktów do wykreślenia, spróbuj pokazać wszystkie punkty, a nie tylko linię. Jeśli uwzględnienie punktów zwiększyłoby interpretowalność wykresu, inną alternatywą jest uwzględnienie luki w linii, aby pokazać, gdzie brakuje wartości.,

interpolowanie krzywej między punktami

na standardowym wykresie liniowym każdy punkt jest połączony z następnym odcinkiem linii prostej, od pierwszego do ostatniego. Jednak może istnieć estetyczna pokusa, aby spróbować połączyć wszystkie punkty płynnie, dopasowując krzywą, która przechodzi przez wszystkie punkty na raz. Powinieneś bezwzględnie oprzeć się tej pokusie! Jak widać w poniższym przykładzie, próba tego rodzaju dopasowania będzie zapewniona zniekształcenia postrzegania trendów w danych., Kierunek i stromoĺ „Ä ‡ linii ma wskazywaÄ ‡ na zmianÄ ™ wartoĹ” ci, a wiÄ ™ c krzywa moĹźe wskazywaÄ ‡ na obecnoĹ ” Ä ‡ dodatkowych punktów danych pomiÄ ™ dzy rzeczywistymi pomiarami, ktĂłre nie istniejÄ….

Korzystanie z wprowadzającej w błąd podwójnej osi

przykłady wykresów liniowych z wieloma liniami do tej pory każda linia była częścią tej samej domeny, a zatem można ją plotować na tej samej osi. Nie ma jednak nic, co ogranicza każdą linię do przedstawiania wartości dla tych samych jednostek., Gdy wykres liniowy zawiera dwie serie, z których każda przedstawia podsumowanie innej zmiennej, to kończymy z wykresem osi podwójnej.

problem z wykresem dwuosiowym polega na tym, że można go łatwo manipulować, aby wprowadzać w błąd. W zależności od tego, jak każda oś jest skalowana, postrzegana relacja między dwiema liniami może ulec zmianie. W dwóch działkach poniżej, liczba tygodniowych prób i subskrypcji są wykreślone w działkach dwuosiowych. Dane są dokładnie takie same dla każdego, ale ze względu na wybór skalowania pionowego dla każdej zmiennej, wywnioskowany związek między zmiennymi ulegnie zmianie.,

chociaż wiele narzędzi wizualizacji umożliwia tworzenie wykresów dwuosiowych, wspólne zalecenia sugerują, że nie są one zgodne, niezależnie od tego, czy obie osie znajdują się w tych samych lub oddzielnych domenach. Zamiast tego, fasetowanie dwóch linii w osobne działki nadal pozwala na ogólne wzorce zmian być przestrzegane dla obu zmiennych, zmniejszając pokusy, aby porównać je w mylący sposób.,

opcje wspólnego wykresu liniowego

zawierają dodatkowe linie, aby pokazać niepewność

gdy mamy linię, która przedstawia podsumowanie statystyczne, takie jak średnia lub mediana, możemy również mieć opcję dodania do wykresu, aby wyświetlić niepewność lub zmienność danych w każdym wykresie. Jednym ze sposobów jest dodanie pasków błędów w każdym punkcie, aby pokazać odchylenie standardowe lub inną miarę niepewności. Inną alternatywą jest dodanie linii pomocniczych powyżej lub poniżej linii, aby pokazać pewne ograniczenia na danych., Linie te mogą być renderowane jako cieniowanie, aby pokazać najpopularniejsze wartości danych, jak w poniższym przykładzie.

Sparkline

specjalnym przypadkiem użycia wykresu liniowego jest sparkline. Sparkline jest zasadniczo małym wykresem liniowym, zbudowanym tak, aby można go było umieścić zgodnie z tekstem lub obok wielu wartości w tabeli. Ze względu na niewielki rozmiar nie będzie zawierał żadnych etykiet. Statystyki mogą być umieszczone obok sparkline, aby wskazać wartości początkowe i końcowe, a może minimalne lub maksymalne., Głównym punktem sparkline jest Pokazywanie zmian w danym okresie czasu i jest często postrzegane w kontekstach finansowych.

Wykres Ridgeline

jednym typem wykresu wariantowego dla wykresu liniowego z wieloma liniami jest wykres ridgeline. Na wykresie ridgeline każda linia jest wykreślona na innej osi, lekko przesunięta od siebie pionowo. To niewielkie przesunięcie może zaoszczędzić na przestrzeni w porównaniu do pełnego fasetowania działek. Podobnie jak sparkline, oznaczenia osi pionowych są zwykle odrzucane: trudno byłoby odczytać te wartości na różnych osiach., Wykresy Ridgeline są używane głównie do porównywania wielu grup na ich rozkładach częstotliwości. Jest to najbardziej przydatne, gdy wyraźny wzór jest widoczny, gdy linie są uporządkowane w jakiś sposób.

wykres słupkowy

jeśli zmienna, którą chcemy wyświetlić na osi poziomej, nie jest numeryczna ani uporządkowana, ale kategoryczna, musimy użyć wykresu słupkowego zamiast wykresu liniowego. Słupki na wykresie słupkowym są zwykle oddzielone małymi odstępami, które pomagają podkreślić dyskretny charakter wykreślanych kategorii., Należy jednak pamiętać, że gdy nasza oś pozioma jest numeryczna lub uporządkowana, nie jesteśmy ograniczeni do używania wykresu słupkowego, jak pokazano w poniższym przykładzie.

Left: wykres słupkowy nad grupami kategorycznymi. Po prawej: wykres słupkowy nad grupami temporalnymi.

Wykres Kropkowy

innym typem wykresu, którego możemy użyć, gdy zmienna osi poziomej jest kategoryczna, jest wykres kropkowy lub wykres Kropkowy. Wykres punktowy jest jak wykres liniowy, z tym wyjątkiem, że nie ma odcinków linii łączących kolejne punkty., Ten brak segmentów linii uwalnia punkty od ich sekwencyjnego postępu, a więc kolejność etykiet i punktów może być dowolnie regulowana jak wykres słupkowy. Główną zaletą korzystania z wykresu kropkowego nad wykresem słupkowym jest to, że wykres kropkowy, podobnie jak wykres liniowy, nie musi zawierać zerowej linii bazowej. Jeśli mamy wartości ponad poziomami zmiennej kategorycznej, ale powiązane wartości nie mają znaczącej linii bazowej zerowej, to Wykres kropkowy może być dobrą opcją typu wykresu.,

Histogram

gdy oś pionowa wykresu liniowego przedstawia informacje o rozkładzie częstotliwości, mamy opcję wizualizacji danych jako histogram. Jedną z głównych zalet histogramu jest to, że słupki są bardziej spójne wyświetlanie częstotliwości w każdym pojemniku. Oceny częstotliwości mogą być mylące na wykresie liniowym, zwłaszcza w Szczytach i korytach rozkładu., Jednak wykres liniowy ma jedną zaletę dla wizualizacji rozkładów częstotliwości: jeśli musimy porównać dwie różne grupy, jest to bardzo trudne dla histogramu. Jak widać we wcześniejszej sekcji podczas korzystania z wykresu liniowego, możemy po prostu narysować linie obu grup na tych samych osiach z niewielkim problemem.

Krzywa gęstości

inną alternatywą dla wykresów liniowych opartych na częstotliwości jest krzywa gęstości lub oszacowanie gęstości jądra (KDE)., Podczas gdy wykres liniowy agreguje częstotliwość zliczaną przez Biny na pojedyncze punkty, KDE agreguje udział każdego punktu w sposób ciągły. W KDE każdy punkt składa się z małej bryły woluminu skupionej wokół jego rzeczywistej wartości (jądra tytularnego); suma wszystkich woluminów daje końcową krzywą gęstości. Ponieważ istnieje tak wiele opcji dla kształtu jądra, estymacja gęstości jądra jest zwykle zarezerwowana dla programistycznych podejść do wizualizacji danych.,

Wykres obszarów

Rozszerzenie wykresu linii obejmuje dodanie cieniowania między linią a linią zero-bazową, zwanego wykresem obszarów. Wykres powierzchni można uznać za hybrydę wykresu liniowego z wykresem słupkowym, ponieważ wartości można odczytywać nie tylko z ich pozycji pionowych, ale także z rozmiaru zacienionego obszaru między każdym punktem a linią bazową.,

podłączony wykres punktowy

Jeśli masz dwie serie wartości, które chcesz narysować za pomocą wykresu liniowego, alternatywnym typem wykresu, którego możesz użyć, jest podłączony wykres punktowy. W standardowym wykresie punktowym dwie osie reprezentują dwie interesujące zmienne, A Punkty wykreślone na osiach wskazują wartości tych zmiennych. Jeśli połączymy punkty w kolejności określonej przez trzecią zmienną, taką jak czas, otrzymamy połączony wykres punktowy., Połączony wykres punktowy jest dobry do patrzenia nie tylko na związek między dwiema zmiennymi, ale także na to, jak zmieniają się w czasie lub wartości trzeciej zmiennej.

podłączony wykres punktowy (prawy dolny róg) jest kombinacją dwóch wykresów liniowych (prawy górny róg, lewy dolny róg). Zwróć uwagę na zamienione osie dla prawego górnego wykresu.

narzędzia do wizualizacji

wykres liniowy jest wszechstronnym i użytecznym typem wykresu, dlatego powinien być dostępny w prawie każdym wybranym narzędziu do wizualizacji danych., Podstawowe wykresy liniowe, w których jedna lub więcej linii jest wykreślonych na pojedynczej osi, powinny być powszechne, ale zaawansowane opcje, takie jak podwójne osie, mogą nie być obecne lub wymagać dodatkowej pracy z danymi do skonfigurowania. Wariant ridgeline nie jest często wbudowany i zwykle wymaga niestandardowego programowania lub niestandardowego pakietu do utworzenia. Sparklines również nie są powszechne same w sobie i są częściej postrzegane jako wbudowane w ramach innych narzędzi raportowania.

wykres liniowy jest jednym z wielu różnych typów wykresów, które można wykorzystać do wizualizacji danych., Dowiedz się więcej z naszych artykułów na temat podstawowych typów wykresów, jak wybrać rodzaj wizualizacji danych lub przeglądając pełną kolekcję artykułów w kategorii wykresy.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *