Hvad er et linjediagram?
et linjediagram (aka linjeplot, linjegraf) bruger punkter forbundet med linjesegmenter fra venstre mod højre for at demonstrere ændringer i værdi. Den vandrette akse viser en kontinuerlig progression, ofte den af tid, mens den lodrette akse rapporter værdier for en metrisk af interesse på tværs af denne progression.
linjediagrammet ovenfor viser valutakursen mellem to fiktive valutaer over en seks måneders periode., Efterhånden som tiden skrider frem fra venstre mod højre, forbinder point de daglige valutakurser. Vi kan læse fra den generelle hældning af linien og vertikale positioner, som den sats, der er forbedret fra omkring 0,75 at 0.78 mellem Marts og begyndelsen af April, faldt derefter gradvist til omkring 0.765 i slutningen af Maj og juni.
Når du skal bruge et kurvediagram
vil Du bruge et kurvediagram, når du ønsker at fremhæve ændringer i værdier for en variabel (angivet på den lodrette akse) for kontinuerlig værdier af en anden variabel (afbildet på vandret)., Denne vægt på forandringsmønstre sælges af linjesegmenter, der bevæger sig konsekvent fra venstre mod højre og observerer skråningerne af linjerne, der bevæger sig op eller ned.
På den vandrette akse har du brug for en variabel, der viser kontinuerlige værdier, der har et regelmæssigt måleinterval. Meget almindeligt er denne variabel en tidsmæssig, der genererer en observation hvert minut, time, dag, uge eller måned. Valget af intervalstørrelse eller bin er en beslutning, som analytikeren normalt skal tage for dataene, snarere end at det er en iboende datakarakteristik.,
på den lodrette akse rapporterer du værdien af en anden numerisk variabel for punkter, der falder i hver af de intervaller, der er defineret af den vandrette akse-variabel. Ofte vil dette være en statistisk oversigt som en samlet eller gennemsnitlig værdi på tværs af begivenheder inden for hver bin.
flere linjer kan også afbildes i et enkelt linjediagram for at sammenligne tendensen mellem serier. En almindelig brugssag til dette er at observere opdelingen af dataene på tværs af forskellige undergrupper. Evnen til at plotte flere linjer giver også linjediagrammet et specielt brugstilfælde, hvor det måske normalt ikke vælges., Normalt ville vi bruge et histogram til at skildre frekvensfordelingen af en enkelt numerisk variabel. Da det imidlertid er vanskeligt at plotte to histogrammer på det samme sæt akser, fungerer linjediagrammet som en god sammenligningsform som en erstatning. Linjediagrammer, der bruges til at skildre frekvensfordelinger, kaldes ofte frekvenspolygoner.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., Værdier i den første kolonne angiver positioner for punkter på den vandrette akse for hver linje, der skal afbildes. Hver følgende kolonne angiver den lodrette position for punkter på en enkelt linje.visse værktøjer opretter linjediagrammer fra et andet dataformat, hvor der forventes tre kolonner, uanset hvor mange linjer der skal plottes. I disse tilfælde angiver kolonnerne de vandrette værdier, lodrette værdier, og til hvilken linje til hver række vil blive tildelt.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., For tidsmæssige data kan et for bredt måleinterval betyde, at det tager for lang tid at se, hvor datatendensen fører, og skjule det nyttige signal. På bagsiden af mønten kan et for kort måleinterval kun afsløre støj snarere end signal.test af forskellige intervaller eller stole på dit domænekendskab om, hvilke data der registreres, kan informere dig om et godt valg af binstørrelse. Det kan også være muligt at bruge flere linjer, med en linje til et finkornet interval, og derefter en anden linje for den samlede tendens, i gennemsnit over et rullende vindue.,
plot ikke for mange linjer
med stor magt kommer stort ansvar, så selvom der er den tekniske kapacitet til at sætte mange linjer på et enkelt linjediagram, er det en god ide at være fornuftig i mængden af data, du plotter. En god tommelfingerregel er at begrænse dig selv til fem eller færre linjer, for at plottet ikke ender med at ligne en ulæselig tangle. Men hvis linjerne er godt adskilt, kan du stadig plotte alle de værdier, du ønsker at spore.,
Hvis du finder behovet for at plotte flere linjer, end der kan læses i en enkelt akse, kan du overveje at facetere plottene i et gitter med mindre linjediagrammer. Det vil være sværere at se detaljer i disse plot, så det er en god ide at sortere dem efter nogle vigtige karakteristika (som gennemsnitlig eller endelig værdi) for at hjælpe med at tegne vigtige punkter. Hvis du bruger et værktøj, der giver mulighed for interaktive plots, er et andet alternativ at være i stand til at fremhæve individuelle linjer eller grå ud linjer for at være ude af fokus, som læseren ønsker.,
almindelige misbrug
strengt ved hjælp af en nulværdi-baseline
På trods af at nul-baseline for den lodrette akse er et krav til stregdiagrammer og histogrammer, behøver du ikke at medtage en nul-baseline for et linjediagram. Husk, at hovedmålet med et linjediagram er at understrege ændringer i værdi snarere end størrelsen af værdierne selv. I tilfælde, hvor en nullinje ikke er meningsfuld eller nyttig, er det fint at .oome det lodrette akseområde ind i, hvad der vil gøre ændringerne i værdi mest informative.,
Der er en brugssag, hvor en nul baseline stadig er nødvendig. Når et linjediagram bruges til at vise frekvensfordelinger, bruges det i en kapacitet svarende til søjlediagrammer og histogrammer. Således vil det følge det samme krav om at skulle inkludere en nulværdi baseline som et anker for linjediagrammets højder.,
hvis der ikke konstateres ujævne mellemrum mellem punkterne
Hvis linjediagrammet mangler oplysninger for visse skraldespande, kan huller i posten fortolkes som fantomværdier, hvis linjen ikke indeholder forskellige prikker ved hver observation. Når der ikke er mange punkter at plotte, kan du prøve at vise alle punkterne og ikke kun linjen. Hvis inkludering af punkterne ville mudrede plotets fortolkbarhed, et andet alternativ er at inkludere et hul i linjen for at vise, hvor der mangler værdier.,
interpolering af en kurve mellem punkter
i et standardlinjediagram er hvert punkt forbundet til det næste med et lige linjesegment, fra første til sidste. Imidlertid, der kan være den æstetiske fristelse til at prøve at forbinde alle punkterne glat, montering af en kurve, der går gennem alle punkterne på .n gang. Du bør absolut modstå denne fristelse! Som det ses i eksemplet nedenfor, forsøg på denne form for montering vil være sikker på at fordreje opfattelsen af tendenser i dataene., Linjens retning og stejlhed antages at være tegn på ændring i værdi, og kurven kan derfor ende med at antyde tilstedeværelsen af yderligere datapunkter mellem de faktiske målinger, der ikke findes.
Bruger en vildledende dobbelt akse
Eksempler af line diagrammer med flere linjer har hidtil haft hver linje være en del af det samme domæne, og dermed plottable på samme akse. Der er dog intet, der begrænser hver linje til at skildre værdier på de samme enheder., Når et linjeplot indeholder to serier, der hver viser et resum.af en anden variabel, så ender vi med et dobbeltakse plot.
problemet med en dual-akse plot er, at det let kan manipuleres til at være vildledende. Afhængigt af hvordan hver akse skaleres, kan det opfattede forhold mellem de to linjer ændres. I de to grunde nedenfor er antallet af ugentlige forsøg og abonnementer plottet i dual-a .is plots. Dataene er nøjagtigt de samme for hver, men på grund af valget af lodret skalering for hver variabel ændres det udledte forhold mellem variablerne.,
mens mange visualiseringsværktøjer er i stand til at oprette dobbeltakse-diagrammer, foreslår almindelige anbefalinger imod dette, uanset om de to akser er i de samme eller separate domæner. I stedet, faceting de to linjer i separate plot tillader stadig, at de generelle forandringsmønstre overholdes for begge variabler, samtidig med at fristelserne reduceres til at sammenligne dem på vildledende måder.,
den Fælles linje chart options
Omfatte yderligere linjer til at vise usikkerhed
Når vi har en linje, der viser en statistisk oversigt som et gennemsnit eller median, kan vi også har en mulighed for at tilføje til plot for at vise usikkerhed eller variation i data på de enkelte plottede punkter. En måde at gøre dette på er ved at tilføje fejlbjælker på hvert punkt for at vise standardafvigelse eller en anden usikkerhedsforanstaltning. Et andet alternativ er at tilføje understøttende linjer over eller under linjen for at vise bestemte grænser på dataene., Disse linjer kan gengives som skygge for at vise de mest almindelige dataværdier, som i eksemplet nedenfor.
Sparkline
en særlig anvendelse tilfælde for linjediagrammet er sparkline. En sparkline er i det væsentlige et lille linjediagram, bygget til at blive sat i overensstemmelse med tekst eller ved siden af mange værdier i en tabel. På grund af sin lille størrelse vil den ikke indeholde nogen mærkning. Statistik kan placeres ved siden af sparklinen for at indikere start-og slutværdier, eller måske minimums-eller maksimumværdier., Det vigtigste punkt i en sparkline er at vise ændringer over en periode, og ses ofte i økonomiske sammenhænge.
Ridgeline plot
en variant Diagramtype for et linjediagram med flere linjer er ridgeline plot. I et ridgeline-plot er hver linje plottet på en anden akse, lidt forskudt fra hinanden lodret. Denne lille forskydning kan spare på plads sammenlignet med en komplet faceting af tomter. Ligesom sparklinen undgås lodrette aksemærker typisk: det ville være vanskeligt at læse disse værdier på de forskellige akser., Ridgeline plots bruges hovedsageligt til at sammenligne masser af grupper på deres frekvensfordelinger. Dette er mest nyttigt, når et klart mønster er synligt, når linjerne bestilles på en eller anden måde.
søjlediagram
Hvis variablen, vi vil vise på den vandrette akse, ikke er numerisk eller bestilt, men i stedet kategorisk, skal vi bruge et søjlediagram i stedet for et linjediagram. Søjlerne i et søjlediagram er normalt adskilt af små huller, som hjælper med at understrege den diskrete karakter af de kategorier, der er tegnet., Bemærk dog, at når vores vandrette akse er numerisk eller bestilt, er vi ikke begrænset til at bruge et søjlediagram, som det ses i eksemplet nedenfor.
Dot plot
en Anden diagramtype, vi kan bruge, når den vandrette akse variable er kategoriske er dot-plot, eller Cleveland-punktdiagram. Dot-plottet er som et linjeplot, bortset fra at der ikke er nogen linjesegmenter, der forbinder på hinanden følgende punkter., Denne mangel på linjesegmenter frigør punkterne fra deres sekventielle progression, og derfor kan rækkefølgen af etiketter og punkter frit justeres som et søjlediagram. Den største fordel ved at bruge en prik plot over et søjlediagram er, at en prik plot, ligesom en linje diagram, ses ikke at omfatte en nul-baseline. Hvis vi har værdier over niveauer af en kategorisk variabel, men tilknyttede værdier ikke har en meningsfuld nul-baseline, kan dot-plottet være en god diagramtype mulighed.,
Histogram
Når den lodrette akse i et kurvediagram viser oplysninger om en frekvens fordeling, vi har en mulighed for at visualisere data, som et histogram i stedet. En af de vigtigste fordele ved histogrammet er, at søjlerne er en mere ensartet visning af frekvens inden for hver bin. Frekvensafgørelser kan være vildledende i et linjediagram, især i toppe og trug i en distribution., Et linjediagram har dog en fordel til at visualisere frekvensfordelinger: hvis vi har brug for at sammenligne to forskellige grupper, er dette meget vanskeligt for et histogram. Som det ses i et tidligere afsnit, når vi bruger et linjediagram, kan vi bare plotte de to gruppers linjer på de samme akser med lidt problem.
Tæthedskurve
et andet alternativ til frekvensbaserede linjediagrammer er tæthedskurven eller Kernel density estimate (KDE)., Mens et linjediagram aggregerer frekvensen tæller med skraldespande i enkeltpunkter, samler KDE bidraget fra hvert punkt på en kontinuerlig måde. I et KDE bidrager hvert punkt med en lille klump volumen centreret omkring dens sande værdi( titulærkernen); summen af alle volumener giver den endelige tæthedskurve. Da der er så mange muligheder for kernens form, er kernetæthedsestimering normalt forbeholdt programmatiske tilgange til datavisualisering.,
områdediagram
en udvidelse af linjediagrammet indebærer tilføjelse af skygge mellem linjen og en nul-baseline, kaldet et områdediagram. Områdediagrammet kan betragtes som en hybrid af linjediagrammet med søjlediagrammet, da værdier kan læses fra ikke kun deres lodrette positioner, men også størrelsen på det skraverede område mellem hvert punkt og baseline.,
tilsluttet scatter plot
Hvis du har to serier af værdier, som du vil plotte ved hjælp af et linjediagram, er en alternativ diagramtype, du kan bruge, det tilsluttede scatter plot. I en standard scatter plot, de to akser repræsenterer to variabler af interesse, og punkter plottet på akserne angiver værdier på disse variabler. Hvis vi tilsluttede punkter i en rækkefølge, der er angivet med en tredje variabel som tid, får vi et tilsluttet scatter plot., Et tilsluttet scatter plot er godt til at se på ikke kun forholdet mellem to variabler, men også hvordan de ændrer sig over tid eller værdier af en tredje variabel.
visualiseringsværktøjer
linjediagrammet er en alsidig og nyttig diagramtype, og det skal derfor være tilgængeligt i stort set ethvert datavisualiseringsværktøj, du vælger., Grundlæggende linjediagrammer, hvor en eller flere linjer er afbildet på en enkelt akse, skal være almindelige, men avancerede indstillinger som dobbeltakser er muligvis ikke til stede eller kræver yderligere dataarbejde for at konfigurere. Ridgeline-varianten er ikke en almindelig indbygget, og kræver normalt brugerdefineret programmering eller en brugerdefineret pakke til at oprette. Sparklines også er ikke almindelige på egen hånd, og er oftere ses som indbygget som en del af andre rapporteringsværktøjer.linjediagrammet er en af mange forskellige diagramtyper, der kan bruges til visualisering af data., Lær mere fra vores artikler om vigtige diagramtyper, hvordan man vælger en type datavisualisering, eller ved at gennemse den fulde samling af artikler i kategorien diagrammer.