Co je spojnicový graf?

linkový graf (aka line plot, line graph) používá body spojené segmenty řádků zleva doprava k prokázání změn hodnoty. Vodorovná osa znázorňuje kontinuální progresi, často to času, zatímco svislá osa hlásí hodnoty pro metriku zájmu napříč touto progresí.

linkový graf výše ukazuje směnný kurz mezi dvěma fiktivními měnami za šestiměsíční období., Jak čas postupuje zleva doprava, body spojují denní směnné kurzy. Můžeme číst z obecné sklon přímky a její vertikální pozice, že rychlost se zlepšila z asi 0,75 až 0,78 mezi Březnu a počátkem dubna, pak postupně klesala, aby se o 0.765 na přelomu Května a června.

Když byste měli použít spojnicový graf

Budete používat spojnicový graf, když chcete zdůraznit změny hodnot jedné proměnné (je vynesena na svislé ose) pro kontinuální hodnoty druhé proměnné (vyneseny na vodorovné)., Tento důraz na vzory změny je prodává úseček důsledně pohybující se zleva doprava a pozorování svazích linky pohybuje nahoru nebo dolů.

na vodorovné ose potřebujete proměnnou, která zobrazuje spojité hodnoty, které mají pravidelný interval měření. Velmi často je tato proměnná časová, která generuje pozorování každou minutu, hodinu, den, týden nebo měsíc. Volba velikosti intervalu nebo bin je rozhodnutí, které analytik obvykle bude muset učinit pro data, spíše než to, že je vlastní datovou charakteristikou.,

na svislé ose nahlásíte hodnotu druhé číselné proměnné pro body, které spadají do každého z intervalů definovaných proměnnou horizontální osy. Často to bude statistické shrnutí jako celková nebo průměrná hodnota napříč událostmi v každém koši.

více řádků lze také vykreslit v grafu jednoho řádku pro porovnání trendu mezi sériemi. Běžným případem použití je sledovat rozdělení dat v různých podskupinách. Schopnost vykreslit více řádků také poskytuje linkový graf zvláštní případ použití, kde nemusí být obvykle vybrán., Normálně bychom použili histogram k zobrazení frekvenčního rozložení jedné číselné proměnné. Protože je však obtížné vykreslit dva histogramy na stejnou sadu OS, řádkový graf slouží jako dobrý způsob srovnání jako náhrada. Řádkové grafy používané k zobrazení frekvenčních distribucí se často nazývají frekvenční polygony.

Tento řádek graf ukazuje, existuje mnoho více uživatele cest než hosté, ale hosté mají tendenci trvat déle, výlety na průměr.,ure
Date Guests Subscribers
2019-05-01 19 103
2019-05-02 22 105
2019-05-03 20 98
2019-05-04 26 83

To use a line chart, data often needs to be aggregated into a table with two or more columns., Hodnoty v prvním sloupci označují pozice bodů na vodorovné ose pro každý řádek, který má být vykreslen. Každý následující sloupec označuje svislou polohu bodů jednoho řádku.

některé nástroje vytvářejí grafy řádků z jiného datového formátu, kde se očekávají tři sloupce bez ohledu na to, kolik řádků má vykreslit. V těchto případech sloupce určují vodorovné hodnoty, svislé hodnoty a ke kterému řádku bude přiřazen každý řádek.,/th> 2019-03-01 Guest 23 2019-03-01 Subscriber 102 2019-03-02 Guest 24 2019-03-03 Subscriber 77 … … …

Best practices for using a line chart

Choose an appropriate measurement interval

An important aspect of creating a line chart is selecting the right interval or bin size., U časových dat může příliš široký interval měření znamenat, že trvá příliš dlouho, než se zjistí, kde trend dat vede, a skryje užitečný signál. Na druhé straně mince může příliš krátký interval měření odhalit spíše šum než signál.

testování různých intervalů nebo spoléhání se na znalosti vaší domény o tom, jaká data jsou zaznamenávána, vás může informovat o dobré volbě velikosti bin. To může také být možné použít více řádků, jeden řádek pro jemnozrnné interval, a pak druhý řádek celkový trend, v průměru přes rolovací okno.,

ne spiknutí, příliš mnoho řádků

S velkou mocí přichází velká zodpovědnost, takže zatímco tam je technická schopnost dát mnoho řádků, na jednom řádku grafu, je to dobrý nápad, aby se v rozumné množství dat, které jste pozemku. Dobrým pravidlem je omezit se na pět nebo méně řádků, aby spiknutí nakonec vypadalo jako nečitelná spleť. Pokud jsou však řádky dobře odděleny, můžete stále vykreslit všechny hodnoty, které chcete sledovat.,

Pokud zjistíte, že je třeba, aby se děj více řádků, než lze číst v jedné osy, pak můžete zvážit faceting pozemků do mřížky menší linky grafy. Na těchto pozemcích bude obtížnější vidět podrobnosti, takže je dobré je třídit podle nějaké důležité charakteristiky (jako je průměrná nebo konečná hodnota), která pomůže čerpat důležité body. Pokud používáte nástroj, který umožňuje interaktivní grafy, další alternativou je, aby bylo možné zvýraznit jednotlivé řádky nebo šedé řádky být rozostřený jako čtenář touží.,

Společné zneužívá

Striktně pomocí nulové hodnoty výchozí

Navzdory nulové výchozí hodnoty pro svislou osu je požadavek, pro sloupcové grafy a histogramy, nemusíte zahrnovat žádné výchozí pro spojnicový graf. Připomeňme, že hlavním cílem linkového grafu je zdůraznit změny hodnoty, spíše než velikost samotných hodnot. V případech, kdy nulová čára není smysluplná nebo užitečná, je v pořádku přiblížit rozsah svislé osy do toho, co způsobí, že změny hodnoty budou nejvíce informativní.,

existuje jeden případ použití, kdy je stále nutná nulová základní linie. Když spojnicový graf používá k zobrazení frekvenční distribuce, pak je používán v kapacita odpovídá sloupcové grafy a histogramy. Tedy, to bude sledovat stejný požadavek o nutnosti zahrnovat nulové hodnoty baseline jako kotva pro spojnicový graf je výšin.,

Nedaří identifikovat nerovnoměrné mezery mezi body

Když spojnicového grafu, chybí informace pro určité přihrádky, mezery v záznamu může být interpretován jako phantom hodnoty, pokud řádek neobsahuje zřetelné tečky při každém pozorování. Když není mnoho bodů na spiknutí, zkuste ukázat všechny body, a ne jen čáru. Pokud by zahrnutí bodů zabořilo interpretovatelnost spiknutí, další alternativou je zahrnout mezeru do řádku a ukázat, kde chybí hodnoty.,

Interpolační křivky mezi body

Ve standardní linka graf, každý bod je připojen na další s přímkou segmentu, od první do poslední. Může však existovat estetické pokušení pokusit se hladce propojit všechny body a přizpůsobit křivku, která prochází všemi body najednou. Měli byste absolutně odolat tomuto pokušení! Jak je vidět v níže uvedeném příkladu, pokus o tento druh montáže bude zajištěn zkreslením vnímání trendů v datech., Směr a strmost čáry má naznačovat změnu hodnoty, a tak křivka může nakonec znamenat přítomnost dalších datových bodů mezi skutečnými měřeními, která neexistují.

Použití zavádějící dual-osy

Příklady line grafy s více řádky, dosud měl každý řádek být součástí stejné domény, a tak plottable na stejné ose. Neexistuje však nic, co by omezovalo každý řádek, aby zobrazoval hodnoty na stejných jednotkách., Když řádek obsahuje dvě série, z nichž každá zobrazuje souhrn jiné proměnné, pak skončíme s dvojitou osou.

problém s dvojosým spiknutím spočívá v tom, že lze snadno manipulovat tak, aby byl zavádějící. V závislosti na tom, jak je každá osa zmenšena, lze změnit vnímaný vztah mezi oběma čarami. Ve dvou níže uvedených parcelách je počet týdenních pokusů a odběrů vykreslen na dvouosých pozemcích. Data jsou pro každou přesně stejná, ale vzhledem k volbě vertikálního měřítka pro každou proměnnou se změní odvozený vztah mezi proměnnými.,

zatímco mnoho vizualizačních nástrojů je schopno vytvářet dvouosé grafy, společná doporučení naznačují proti tomu, bez ohledu na to, zda jsou obě osy ve stejných nebo samostatných doménách. Místo toho, facetování dvou řádků do samostatných grafů stále umožňuje pozorovat obecné vzorce změn pro obě proměnné, a zároveň snížit pokušení je porovnávat zavádějícími způsoby.,

Společný line možnosti grafu

Zahrnout další řádky ukázat, nejistota

Když máme řádek, který zobrazuje statistické shrnutí, jako je průměr nebo medián, můžeme mít také možnost přidat se ke spiknutí k zobrazení nejistoty a variability v datech u každého vykresleného bodu. Jedním ze způsobů, jak toho dosáhnout, je přidání chybových pruhů v každém bodě, které ukazují směrodatnou odchylku nebo jiné opatření nejistoty. Další alternativou je přidání podpůrných řádků nad nebo pod řádek, aby se na datech zobrazily určité hranice., Tyto řádky mohou být vykresleny jako stínování pro zobrazení nejběžnějších datových hodnot, jako v následujícím příkladu.

Sparkline

speciální případ použití pro spojnicový graf je sparkline. Sparkline je v podstatě malý řádkový graf, postavený tak, aby byl v souladu s textem nebo vedle mnoha hodnot v tabulce. Vzhledem k jeho malé velikosti nebude obsahovat žádné označení. Statistiky mohou být umístěny vedle sparkline pro označení počáteční a koncové hodnoty, nebo snad minimální nebo maximální hodnoty., Hlavním bodem sparkline je ukázat změnu v průběhu času, a je často vidět ve finančních kontextech.

Ridgeline spiknutí

Jedna varianta typ grafu na spojnicový graf s více řádky, je ridgeline pozemku. Na pozemku ridgeline je každá čára vykreslena na jiné ose, mírně posunutá od sebe svisle. Tento mírný posun může ušetřit místo ve srovnání s úplným fazetováním pozemků. Stejně jako sparkline se obvykle vyhýbají svislým osám: bylo by obtížné tyto hodnoty přečíst na různých osách., Ridgeline grafy se používají hlavně k porovnání mnoha skupin na jejich frekvenčních distribucích. To je nejužitečnější, když je viditelný jasný vzor, když jsou řádky nějakým způsobem uspořádány.

sloupcový graf,

Pokud proměnná chceme ukázat na horizontální ose není numerický nebo objednal, ale místo toho kategorické, pak musíme použít sloupcový graf, místo spojnicového grafu. Bary ve sloupcovém grafu jsou obvykle odděleny malými mezerami, které pomáhají zdůraznit diskrétní povahu kategorií vynese., Všimněte si však, že když je naše vodorovná osa číselná nebo uspořádaná, nejsme omezeni na použití sloupcového grafu, jak je vidět v níže uvedeném příkladu.

Vlevo: Bar graf, přes kategorické skupiny. Vpravo: sloupcový graf nad časovými skupinami.

Dot plot

Další typ grafu můžeme použít při vodorovné ose je proměnná kategorické je dot plot, nebo Cleveland dot plot. Bodový graf je jako čára, kromě toho, že neexistují žádné segmenty čáry spojující po sobě jdoucí body., Tento nedostatek segmentů řádků osvobozuje body od jejich postupného postupu, a tak lze pořadí štítků a bodů libovolně upravit jako sloupcový graf. Hlavní výhodou použití dot plot přes bar graf, je to dot plot, jako spojnicový graf, není zavázán patří nulové linie. Pokud máme hodnoty nad úrovněmi kategorické proměnné, ale přidružené hodnoty nemají smysluplnou nulovou základní linii, pak může být bodový graf dobrou volbou typu grafu.,

Histogram

Když se svislou osou spojnicový graf zobrazuje informace o frekvenci, distribuci, máme možnost vizualizovat data jako histogram místo. Jednou z hlavních výhod histogramu je, že tyče jsou konzistentnějším zobrazením frekvence v každém koši. Frekvenční úsudky mohou být zavádějící v řádkovém grafu, zejména ve špičkách a žlabech distribuce., Linkový graf má však jednu výhodu pro vizualizaci frekvenčních distribucí: pokud potřebujeme porovnat dvě různé skupiny, je to pro histogram velmi obtížné. Jak je vidět v dřívější části při použití linkového grafu, můžeme jen vykreslit čáry dvou skupin na stejné osy s malým problémem.

křivka hustoty

další alternativou pro frekvenční linkové grafy je křivka hustoty nebo odhad hustoty jádra (KDE)., Zatímco linkový graf agreguje počty frekvencí podle zásobníků do jednotlivých bodů, KDE agreguje příspěvek každého bodu kontinuálním způsobem. V KDE, každý bod přispívá malý kus objemu soustředěný kolem jeho skutečné hodnoty (titulární jádro); součet všech svazků dává křivku konečné hustoty. Vzhledem k tomu, že existuje tolik možností pro tvar jádra, odhad hustoty jádra je obvykle vyhrazen pro programové přístupy k vizualizaci dat.,

Oblast grafu

prodloužení linky graf zahrnuje přidání stínování mezi linkou a nulové-základní, tzv. oblast grafu. Oblasti grafu může být považován za hybrid spojnicový graf s sloupcový graf, protože hodnoty lze číst nejen jejich vertikální pozice, ale také na velikosti zastíněné plochy mezi každý bod a linie.,

Připojen bodový graf

Pokud máte dvě řady hodnot, jež chcete vykreslit pomocí spojnicového grafu, alternativní typ grafu můžete použít je připojen bodový graf. Ve standardním rozptylovém grafu představují obě osy dvě proměnné zájmu a body vynesené na osách označují hodnoty těchto proměnných. Pokud jsme spojili body v pořadí určeném třetí proměnnou, jako je čas, dostaneme připojený bodový graf., Připojené scatter plot je dobrý na koukání není jen vztah mezi dvěma proměnnými, ale také to, jak se mění v čase nebo hodnotách třetí proměnné.

připojené bodový graf (vpravo) je kombinací dvou řádek tabulky (horní vpravo, dolní vlevo). Všimněte si vyměněných OS pro pravý horní graf.

Vizualizace

spojnicový graf je univerzální a užitečný typ grafu, a proto by měly být k dispozici v podstatě žádné nástroje pro vizualizaci dat, můžete si vybrat., Základní linie grafy, kde jeden nebo více řádků jsou vyneseny na jedné ose by měly být běžné, ale pokročilé možnosti, jako jsou duální osy nemusí být přítomen, nebo vyžadují další práci dat nastavit. Ridgeline varianta není společný vestavěný, a obvykle vyžaduje vlastní programování nebo vlastní balíček vytvořit. Sparklines také nejsou běžné samy o sobě, a jsou častěji vnímány jako vestavěné jako součást jiných nástrojů pro podávání zpráv.

linkový graf je jedním z mnoha různých typů grafů, které lze použít pro vizualizaci dat., Více se dozvíte z našich článků na základní typy grafů, jak si vybrat typ dat, vizualizace, nebo procházení celé kolekce článků v grafech kategorie.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *