Hva er et linjediagram?
Et linjediagram (aka linje tomt, linjediagram) bruker poeng forbundet med linje segmenter fra venstre til høyre for å vise endringer i verdi. Den horisontale aksen viser en kontinuerlig progresjon, ofte som tid, mens den vertikale aksen rapporter verdier for en beregning av renter over at progresjon.
line diagrammet over viser vekslingskurs mellom to fiktive valutaer over en seks måneders periode., Som tiden går fra venstre til høyre, poeng koble den daglige valutakurser. Vi kan lese fra den generelle skråningen av linjen og dens vertikale posisjoner at satsen økt fra om lag 0,75 til 0.78 mellom Mars og tidlig i April, deretter falt gradvis til om 0.765 i slutten av Mai og juni.
Når du bør bruke et linjediagram
vil Du bruke et linjediagram hvis du ønsker å understreke endringer i verdier for en variabel (plottet på den vertikale aksen) for kontinuerlig verdier av en annen variabel (plottet på den horisontale)., Denne vekt på mønstre av endring er solgt av linjesegmenter flytte konsekvent fra venstre til høyre og observere bakkene av linjene for å flytte opp eller ned.
På den horisontale aksen, trenger du en variabel som viser kontinuerlig verdier som har et regelmessig intervall av målingen. Svært ofte denne variabelen er en temporal ett, genererer en observasjon for hvert minutt, time, dag, uke eller måned. Valg av intervall størrelse, eller bin, er en beslutning som analytiker vil vanligvis trenger å gjøre for data, snarere enn at det er en iboende data karakteristisk.,
På den vertikale aksen, vil du rapportere verdien av et sekund numerisk variabel for poeng som faller i hver av de intervaller som er definert av den vannrette aksen variable. Ofte vil dette være en statistisk sammendrag som en sum eller gjennomsnitt verdi over hendelser innen hver utskuff.
Flere linjer kan også være plottet i en enkelt linje diagrammet for å sammenligne utviklingen mellom serier. Et vanlig bruksområde for dette er å observere fordelingen av data på tvers av ulike undergrupper. Evnen til å markere flere linjer gir også linjediagram en spesiell bruk tilfelle der det kan vanligvis ikke bli valgt., Normalt, ville vi bruke et histogram for å skildre frekvens distribusjon av en enkelt numeriske variable. Men, siden det er vanskelig å plotte to histogrammer på samme sett av akser, linjediagram fungerer som en god modus av sammenligningen som en erstatning. Linjediagrammer brukt for å skildre frekvens-distribusjoner er ofte kalt frekvens polygoner.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., Verdier i første kolonne angir posisjoner for poeng på den horisontale aksen for hver linje som skal plottes. Hver følgende kolonne angir vertikal posisjon for poeng på en enkelt linje.
Visse verktøy til å lage linjediagrammer fra et annet dataformat der tre kolonner er forventet uavhengig av hvor mange linjer du vil tomten. I disse tilfellene, kolonnene angir den horisontale verdier, vertikal verdier, og til hvilken linje for hver rad vil bli tildelt.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., For temporale data, et for bredt i en måling intervall kan bety at det tar for lang tid, for å se hvor data trenden er ledende, gjemmer seg bort nyttig signal. På baksiden av mynten, et altfor kort en måling intervall kan bare avdekke støy snarere enn signal.
å Teste ut ulike intervaller eller stole på ditt domene kunnskap om hvilke data som blir registrert kan også informere deg om et godt utvalg av bin størrelse. Det kan også være mulig å bruke flere linjer, med en linje for en finkornet intervall, og deretter en ny linje for den generelle trenden, gjennomsnitt over en rullerende vindu.,
ikke tomt for mange linjer
Med stor makt følger et stort ansvar, så selv om det er den tekniske kapasiteten til å sette mange linjer på en enkelt linje diagram, er det en god idé å være fornuftig i mengden av data som du tomten. En god tommelfingerregel er å begrense deg til fem eller færre linjer, for at tomten ende opp som ser ut som en uleselig floke. Imidlertid, hvis linjene er godt atskilt, kan du fortsatt tomten alle verdier du ønsker å spore.,
Hvis du finner det nødvendig å plotte flere linjer enn det som kan leses i en enkelt akse, kan du vurdere fasetter tomter i et rutenett av mindre linjediagrammer. Det vil være vanskeligere å se detaljer i disse tomter, så er det en god idé å sortere dem etter noen viktige kjennetegn (som gjennomsnittet eller endelige verdien) til å trekke ut viktig poeng. Hvis du bruker et verktøy som gjør det mulig for interaktive tomter, et annet alternativ er å være i stand til å fremheve enkelte linjer eller grå ut linjer for å være ute av fokus som leseren ønsker.,
Vanlige misbruker
Strengt ved hjelp av en null-verdi baseline
til Tross for null baseline for den vertikale aksen blir et krav for bar diagrammer og histogrammer, du trenger ikke å ta med en null baseline for et linjediagram. Husker at det viktigste målet for et linjediagram er å understreke endringer i verdi, snarere enn omfanget av verdiene i seg selv. I tilfeller der en null-linjen er ikke meningsfylt eller nyttig, det er fint å zoome og den vertikale aksen utvalg i hva du vil gjøre endringer i verdien mest informative.,
Det er én sak hvor en null baseline er fortsatt nødvendig, men. Når et linjediagram som brukes for å vise frekvensen distribusjoner, så er det å bli brukt i en kapasitet tilsvarende bar diagrammer og histogrammer. Det vil således følge de samme krav som trenger å inneholde en null-verdi baseline som et anker for linje diagram høyder.,
Unnlate å identifisere ujevne mellomrom mellom punktene
Når linjediagram mangler opplysninger for enkelte hyllene, hull i posten kan tolkes som phantom verdier hvis linjen ikke inkluderer tydelige prikker på hver observasjon. Når det ikke mange poeng til å tegne, prøve å vise alle punkter og ikke bare den linjen. Hvis inkludert poeng ville gjørmete opp interpretability av tomten, et annet alternativ er å inkludere et gap i linjen for å vise hvor det er manglende verdier.,
Interpolere en kurve mellom punktene
I en standard linjediagram, hvert punkt er koblet til den neste med et rett linjestykke, fra først til sist. Det kan imidlertid være estetisk fristelsen til å prøve og koble alle poeng jevnt, slik at en kurve som går gjennom alle punktene på en gang. Du bør absolutt motstå denne fristelsen! Som vi har sett i eksemplet nedenfor, forsøker denne typen montering vil være sikret en forvrengt oppfatning av trender i dataene., Retning og steepness av linjen er ment å være en indikasjon på endring i verdi, og så kurven kan ende opp med å antyde tilstedeværelsen av ytterligere data poeng mellom de faktiske målinger som ikke eksisterer.
ved Hjelp av en villedende dual axis
Eksempler på linje diagrammer med flere linjer har så langt hadde hver linje være en del av det samme domenet, og dermed plottable på den samme aksen. Det er ingenting som begrenser hver linje for å skildre verdier på samme enheter, imidlertid., Når en linje tomt inkluderer to serier, som hver viser en oppsummering av en annen variabel, så vi ender opp med en dual axis tomten.
problemet med en dual-aksen tomten er at det lett kan bli manipulert til å være villedende. Avhengig av hvor aksene er skalert, oppfattet forholdet mellom de to linjene kan bli endret. I de to grafene nedenfor, antall ukentlige forsøk og abonnementer er plottet i to-akset tomter. Data er nøyaktig den samme for hver enkelt, men på grunn av valg av vertikal skalering for hver variabel, er den antydede forholdet mellom variablene vil endre.,
Mens mange visualisering verktøy er i stand til å skape to-akset diagrammer, felles anbefalinger foreslå mot dette, uavhengig av om de to aksene er i samme eller separate domener. I stedet, fasetter de to linjene i separate tomter fortsatt gjør det mulig for den generelle mønstre av endring for å bli observert for begge variablene, og samtidig redusere fristelser til å sammenligne dem i villedende måter.,
Felles linje figur valg
ta med flere linjer for å vise usikkerhet
Når vi har en linje som viser en statistisk sammendrag som et gjennomsnitt eller median, kan vi også har mulighet til å legge til tomten for å vise usikkerhet eller variasjon i data på hvert plottet punkt. En måte å gjøre dette på er gjennom tillegg av feil barer på hvert punkt for å vise standard avvik eller noen andre usikkerhet måle. Et annet alternativ er å legge til støtte linjer over eller under linjen for å vise visse grenser på data., Disse linjene kan gjengis som skygge for å vise de vanligste data verdier, som i eksempelet nedenfor.
Sparkline
En spesiell use case for linjediagram er sparkline. En sparkline er egentlig en liten linjediagram, bygget for å bli satt på linje med teksten, eller sammen med mange verdier i en tabell. På grunn av sin lille størrelse, vil det ikke omfatte merking. Statistikk kan plasseres ved siden av sparkline for å angi start-og slutt-verdier, eller kanskje minimum eller maksimum verdier., Det viktigste punktet i en sparkline er å vise endring over tid, og er ofte sett i økonomiske sammenhenger.
Ridgeline tomten
En variant diagramtype for et linjediagram med flere linjer er ridgeline tomten. I en ridgeline tomten, hver linje er plottet på en annen akse, litt forskjøvet i forhold til hverandre vertikalt. Dette liten forskyvning kan lagre på plass i forhold til et komplett fasetter av tomter. Som sparkline, vertikale aksen markeringene er vanligvis unngikk: det ville være vanskelig å lese disse verdiene på de ulike aksene., Ridgeline tomter er i hovedsak brukes til å sammenligne mange av gruppene på deres frekvens distribusjoner. Dette er mest nyttig når et klart mønster er synlig når linjene er organisert på noen måte.
Bar chart
Dersom den variabelen vi ønsker å vise på den horisontale aksen er ikke-numerisk eller bestilt, men i stedet kategorisk, da er vi nødt til å bruke en bar chart i stedet for en linje i diagrammet. Barene i et stolpediagram er vanligvis adskilt av små hull, som bidrar til å understreke den diskrete arten av kategoriene plottet., Vær imidlertid oppmerksom på, når du vår horisontale aksen er numerisk eller bestilt, vi er ikke begrenset mot å bruke et stolpediagram, som vist i eksemplet nedenfor.
prikkplott
en Annen diagramtype vi kan bruke når den horisontale aksen variabelen er kategorisk er prikkplott, eller Cleveland prikkplott. Prikken tomten er som en linje tomt, bortsett fra at det er ingen linjesegmenter koble etterfølgende punkter., Denne mangelen på linje segmenter frigjør poeng fra sine sekvensiell progresjon, og så rekkefølgen av etiketter og poeng kan fritt justeres som et stolpediagram. Den store fordelen med å bruke et prikkplott over et stolpediagram er at et prikkplott, som et linjediagram, er ikke i takknemlighetsgjeld til å inneholde en null-baseline. Hvis vi har verdier over nivåer av en kategorisk variabel, men tilhørende verdier ikke ha en meningsfull null-baseline, så prikkplott kan være en god figur type.,
Histogram
Når den vertikale aksen i et linjediagram viser informasjon om en frekvens fordeling, har vi en mulighet til å visualisere data som et histogram i stedet. En av de viktigste fordelene med histogrammet er at linjene er en mer konsekvent visning av frekvens innenfor hver utskuff. Frekvens dommer kan være misvisende i et linjediagram, spesielt i topper og bølgedaler av en distribusjon., Men, et linjediagram har imidlertid én fordel for å visualisere frekvens distribusjoner: hvis vi trenger å sammenligne to forskjellige grupper, dette er veldig vanskelig for et histogram. Som vi har sett i et tidligere avsnitt når du bruker et linjediagram, kan vi bare plotte to grupper’ linjer på samme akser med lite problem.
Tetthet kurve
et Annet alternativ for frekvens-basert linjediagrammer er tettheten kurven, eller kernel density estimat (KDE)., Mens et linjediagram gruppene frekvens teller ved dunker inn ett poeng, KDE aggregater bidrag av hvert punkt i en kontinuerlig måte. I KDE, hvert punkt bidrar med en liten klump av volum sentrert rundt sin sanne verdi, titulær kjerne); summen av alle volumer gir den siste tetthet kurve. Siden det er så mange alternativer for den form for kjernen, kernel density estimering er vanligvis reservert for programmatisk tilnærming til data visualisering.,
– Området chart
En utvidelse til linjediagram innebærer tilsetning av skyggelegging mellom linje og en null-baseline, kalt et område i diagrammet. Området diagrammet, kan betraktes som en hybrid av linjediagram med stolpediagram, siden verdiene kan leses fra ikke bare for sin vertikale posisjoner, men også størrelsen på det skraverte området mellom hvert punkt og grunnlinjen.,
Tilkoblede scatter plot
Hvis du har to serier av verdier som du ønsker å plotte bruke et linjediagram, en alternativ diagramtype du kan bruke er koblet spredningsplott. I en standard scatter plott, de to aksene representerer to variabler av interesse, og poeng plottet på aksene viser verdier på disse variablene. Hvis vi koblet poeng i en rekkefølge spesifisert av en tredje variabel som tid, får vi en tilkoblet spredningsplott., En tilkoblet scatter-plot er bra for å se på ikke bare forholdet mellom to variabler, men også hvordan de endrer seg over tid eller verdier av en tredje variabel.
Visualisering verktøy
linjediagram er en allsidig og nyttig diagramtype, og slik bør det være tilgjengelig i stort sett alle visualisering av data verktøyet du velger., Grunnleggende linje diagrammer der én eller flere linjer er plottet på en enkelt akse bør være felles, men avanserte alternativer som dual-aksene kan ikke være til stede eller kreve ytterligere data arbeid å sette opp. Den ridgeline varianten er ikke et vanlig innebygd, og krever vanligvis tilpasset programmering eller en egendefinert pakke for å skape. Sparkline-grafikk for er det ikke vanlig å ha på deres egne, og er ofte sett på som bygget inn som en del av øvrige rapportering verktøy.
linjediagram er en av mange ulike diagramtyper som kan brukes for å visualisere data., Les mer fra våre artikler om viktige diagramtyper, hvordan å velge en type visualisering av data, eller ved å surfe på full samling av artikler i diagrammer kategori.