Vad är ett linjediagram?
ett linjediagram (aka linjediagram, linjediagram) använder punkter som är kopplade till linjesegment från vänster till höger för att visa värdeförändringar. Den horisontella axeln visar en kontinuerlig progression, ofta tid, medan den vertikala axeln rapporterar värden för ett metriskt intresse över den progressionen.
linjediagrammet ovan visar växelkursen mellan två fiktiva valutor under en sexmånadersperiod., När tiden går från vänster till höger ansluter punkterna de dagliga växelkurserna. Vi kan läsa från linjens allmänna lutning och dess vertikala positioner att hastigheten förbättrades från Ca 0,75 till 0,78 mellan mars och början av April och föll sedan gradvis till ca 0,765 i slutet av maj och juni.
när du ska använda ett linjediagram
använder du ett linjediagram när du vill betona förändringar i värden för en variabel (ritad på den vertikala axeln) för kontinuerliga värden för en andra variabel (ritad på den horisontella)., Denna betoning på förändringsmönster säljs av linjesegment som rör sig konsekvent från vänster till höger och observerar sluttningarna av linjerna som rör sig upp eller ner.
på den horisontella axeln behöver du en variabel som visar kontinuerliga värden som har ett regelbundet mätintervall. Mycket vanligt är denna variabel en temporal, genererar en observation varje minut, timme, dag, vecka eller månad. Valet av intervallstorlek, eller bin, är ett beslut som analytikern vanligtvis behöver göra för data, snarare än att det är en inneboende datakarakteristik.,
på den vertikala axeln kommer du att rapportera värdet för en andra numerisk variabel för punkter som faller i var och en av de intervall som definieras av den horisontella axelvariabeln. Ofta kommer detta att vara en statistisk sammanfattning som ett totalt eller medelvärde över händelser inom varje bin.
flera linjer kan också ritas i ett enda linjediagram för att jämföra trenden mellan serier. Ett vanligt användningsfall för detta är att observera uppdelningen av data i olika undergrupper. Möjligheten att rita flera linjer ger också linjediagrammet ett speciellt användningsfall där det kanske inte brukar väljas., Normalt skulle vi använda ett histogram för att skildra frekvensfördelningen för en enda numerisk variabel. Eftersom det är knepigt att rita två histogram på samma uppsättning axlar, fungerar linjediagrammet som ett bra sätt att jämföra som ett substitut. Linjediagram som används för att skildra frekvensfördelningar kallas ofta frekvenspolygoner.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., Värden i den första kolumnen anger positioner för punkter på den horisontella axeln för varje linje som ska ritas. Varje följande kolumn anger det vertikala läget för punkter på en enda rad.
vissa verktyg skapar linjediagram från ett annat dataformat där tre kolumner förväntas oavsett hur många rader som ska plottas. I dessa fall anger kolumnerna de horisontella värdena, vertikala värdena och till vilken rad till varje rad som ska tilldelas.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., För tidsdata kan ett alltför brett mätintervall innebära att det tar för lång tid att se var datautvecklingen leder, vilket döljer den användbara signalen. På myntets baksida kan ett alltför kort mätintervall bara avslöja brus snarare än signal.
Testa olika intervall eller förlita sig på din domän kunskap om vilka data som spelas in kan informera dig om ett bra val av bin storlek. Det kan också vara möjligt att använda flera linjer, med en rad för ett finkornigt intervall, och sedan en andra rad för den övergripande trenden, i genomsnitt över ett rullande fönster.,
plotta inte för många linjer
med stor kraft kommer stort ansvar, så medan det finns den tekniska kapaciteten att lägga många linjer på ett enda linjediagram är det en bra idé att vara förnuftig i mängden data som du plottar. En bra tumregel är att begränsa dig till fem eller färre linjer, så att tomten slutar se ut som en oläslig troll. Men om linjerna är väl separerade kan du fortfarande rita alla värden du vill spåra.,
om du tycker att det är nödvändigt att rita fler rader än vad som kan läsas i en enda axel, kan du överväga att facettera tomterna i ett rutnät med mindre linjediagram. Det blir svårare att se detaljer i dessa tomter, så det är en bra idé att sortera dem med några viktiga egenskaper (som genomsnittligt eller slutvärde) för att hjälpa till att rita ut viktiga punkter. Om du använder ett verktyg som möjliggör interaktiva tomter, är ett annat alternativ att kunna markera enskilda linjer eller grå ut linjer för att vara ur fokus som läsaren önskar.,
vanliga fel
strikt användning av en nollvärde baslinje
trots noll baslinje för den vertikala axeln är ett krav för stapeldiagram och histogram, behöver du inte inkludera en noll baslinje för ett linjediagram. Minns att huvudmålet med ett linjediagram är att betona värdeförändringar, snarare än storleken på värdena själva. I de fall där en nollinje inte är meningsfull eller användbar är det bra att zooma det vertikala axelområdet till vad som kommer att göra värdeförändringarna mest informativa.,
det finns ett användningsfall där en nollbaslinje fortfarande är nödvändig. När ett linjediagram används för att visa frekvensfördelningar används det i en kapacitet som motsvarar stapeldiagram och histogram. Således kommer det att följa samma krav på att behöva inkludera en nollvärde baslinje som ett ankare för linjediagrammets höjder.,
om man inte identifierar ojämna mellanrum mellan punkterna
När linjediagrammet saknar information för vissa lager, kan luckor i posten tolkas som fantomvärden om linjen inte innehåller tydliga punkter vid varje observation. När det inte finns många poäng att rita, försök att visa alla punkter och inte bara linjen. Om man räknar med punkterna skulle det förvirra tolkbarheten av tomten, är ett annat alternativ att inkludera en lucka i linjen för att visa var det saknas värden.,
interpolera en kurva mellan punkterna
i ett standardlinjediagram är varje punkt ansluten till nästa med ett raklinjesegment, från första till sista. Det kan dock finnas den estetiska frestelsen att försöka länka alla punkter smidigt och passa en kurva som går igenom alla punkter på en gång. Du borde absolut motstå denna frestelse! Som framgår av exemplet nedan, försöker denna typ av montering kommer att vara säker på att snedvrida uppfattningen av trender i data., Linjens riktning och branthet ska vara vägledande för värdeförändring, så kurvan kan hamna vilket innebär att det finns ytterligare datapunkter mellan de faktiska mätningar som inte existerar.
använda en vilseledande dubbel axel
exempel på linjediagram med flera linjer har hittills haft varje rad som en del av samma domän, och därmed plottbar på samma axel. Det finns inget som begränsar varje rad för att skildra värden på samma enheter, dock., När en radplot innehåller två serier, som var och en visar en sammanfattning av en annan variabel, hamnar vi med en dubbel axelplot.
problemet med en tvåaxlig plot är att det lätt kan manipuleras för att vara vilseledande. Beroende på hur varje axel skalas kan det upplevda förhållandet mellan de två linjerna ändras. I de två tomterna nedan anges antalet veckovisa försök och prenumerationer i tvåaxliga tomter. Data är exakt samma för varje, men på grund av valet av vertikal skalning för varje variabel ändras det härledda förhållandet mellan variablerna.,
medan många visualiseringsverktyg kan skapa tvåaxliga diagram, föreslår vanliga rekommendationer mot detta, oavsett om de två axlarna är i samma eller separata domäner. I stället kan de två linjerna i separata tomter fortfarande observeras för de allmänna förändringsmönstren för båda variablerna, samtidigt som frestelserna minskas för att jämföra dem på vilseledande sätt.,
Common line chart options
inkludera ytterligare rader för att visa osäkerhet
När vi har en linje som visar en statistisk sammanfattning som ett genomsnitt eller median, kan vi också ha möjlighet att lägga till i diagrammet för att visa osäkerhet eller variabilitet i data vid varje plottad punkt. Ett sätt att göra detta är genom tillsats av felstavar vid varje punkt för att visa standardavvikelse eller någon annan osäkerhetsåtgärd. Ett annat alternativ är att lägga till stödlinjer över eller under raden för att visa vissa gränser på data., Dessa rader kan göras som skuggning för att visa de vanligaste datavärdena, som i exemplet nedan.
Sparkline
ett speciellt användningsfall för linjediagrammet är sparkline. En sparkline är i huvudsak en liten linjediagram, byggd för att sättas i linje med text eller vid sidan av många värden i en tabell. På grund av sin lilla storlek kommer den inte att innehålla någon märkning. Statistik kan placeras bredvid gnistlinjen för att indikera start-och slutvärden, eller kanske minimala eller maximala värden., Huvudpunkten i en sparkline är att visa förändring under en tidsperiod, och ses ofta i finansiella sammanhang.
Ridgeline plot
en variant Diagramtyp för ett linjediagram med flera linjer är Ridgeline plot. I en ridgelineplot ritas varje linje på en annan axel, något förskjuten från varandra vertikalt. Denna lilla förskjutning kan spara på utrymme jämfört med en komplett fasettering av tomter. Liksom gnistlinjen är vertikala axelmarkeringar vanligtvis avskärmade: det skulle vara svårt att läsa dessa värden på de olika axlarna., Ridgeline tomter används främst för att jämföra massor av grupper på deras frekvensfördelningar. Detta är mest användbart när ett tydligt mönster är synligt när linjerna beställs på något sätt.
stapeldiagram
om variabeln vi vill visa på den horisontella axeln inte är numerisk eller beställd, utan istället kategorisk, måste vi använda ett stapeldiagram istället för ett linjediagram. Staplarna i ett stapeldiagram är vanligtvis åtskilda av små luckor, vilket bidrar till att betona den diskreta karaktären hos de angivna kategorierna., Observera dock att när vår horisontella axel är numerisk eller beställd är vi inte begränsade mot att använda ett stapeldiagram, vilket framgår av exemplet nedan.
Dot plot
en annan diagramtyp som vi kan använda när den horisontella axelvariabeln är kategorisk är dot plot, eller Cleveland dot plot. Dot plot är som en linjeplot, förutom att det inte finns några linjesegment som förbinder på varandra följande punkter., Denna brist på linjesegment frigör punkterna från deras sekventiella progression, och så kan ordningen på etiketter och punkter justeras fritt som ett stapeldiagram. Den största fördelen med att använda en punktplot över ett stapeldiagram är att en punktplot, som ett linjediagram, inte är beholden att inkludera en nollbaslinje. Om vi har värden över nivåer av en kategorisk variabel, men associerade värden inte har en meningsfull nollbaslinje, kan dot plot vara ett bra diagramtypalternativ.,
Histogram
När den vertikala axeln i ett linjediagram visar information om en frekvensfördelning har vi möjlighet att visualisera data som ett histogram istället. En av de viktigaste fördelarna med histogrammet är att staplarna är en mer konsekvent visning av frekvensen inom varje bin. Frekvensdomar kan vara vilseledande i ett linjediagram, särskilt i topparna och dalarna i en distribution., Ett linjediagram har dock en fördel för att visualisera frekvensfördelningar: om vi behöver jämföra två olika grupper är det mycket svårt för ett histogram. Som framgår av ett tidigare avsnitt när du använder ett linjediagram kan vi bara rita de två gruppernas linjer på samma axlar med liten fråga.
Täthetskurva
ett annat alternativ för frekvensbaserade linjediagram är densitetskurvan eller uppskattningen av kärndensitet (KDE)., Medan ett linjediagram aggregerar frekvensantal per bin i enskilda punkter, aggregerar KDE bidraget från varje punkt på ett kontinuerligt sätt. I ett KDE bidrar varje punkt med en liten volym som är centrerad kring dess sanna värde (den titulära kärnan); summan av alla volymer ger den slutliga densitetskurvan. Eftersom det finns så många alternativ för kärnans form, är Kernel density estimation vanligtvis reserverad för programmatiska metoder för datavisualisering.,
Områdesschema
en förlängning av linjediagrammet innebär tillägg av skuggning mellan linjen och en noll-baslinje, kallad ett områdesschema. Områdesschemat kan betraktas som en hybrid av linjediagrammet med stapeldiagrammet, eftersom värden kan läsas från inte bara deras vertikala positioner utan också storleken på det skuggade området mellan varje punkt och baslinjen.,
ansluten scatter plot
om du har två serier av värden som du vill rita med hjälp av ett linjediagram, är en alternativ diagramtyp som du kan använda den anslutna scatter plotten. I en standard scatter-plot representerar de två axlarna två variabler av intresse, och punkter som ritas på axlarna indikerar värden på dessa variabler. Om vi kopplade poäng i en ordning som anges av en tredje variabel som tid får vi en ansluten scatterplot., En ansluten scatter plot är bra för att titta på inte bara förhållandet mellan två variabler, men också hur de förändras över tid eller värden för en tredje variabel.
visualiseringsverktyg
linjediagrammet är en mångsidig och användbar diagramtyp, och det borde vara tillgängligt i stort sett alla datavisualiseringsverktyg du väljer., Grundläggande linjediagram där en eller flera linjer ritas på en enda axel bör vara vanligt, men avancerade alternativ som dubbla axlar kanske inte är närvarande eller kräver ytterligare dataarbete för att ställa in. Ridgeline-varianten är inte en vanlig inbyggd, och kräver vanligtvis anpassad programmering eller ett anpassat paket för att skapa. Även gnisttänger är inte vanliga på egen hand, och ses oftare som inbyggda som en del av andra rapporteringsverktyg.
linjediagrammet är en av många olika diagramtyper som kan användas för att visualisera data., Läs Mer från våra artiklar om viktiga diagramtyper, hur man väljer en typ av datavisualisering eller genom att bläddra i hela samlingen av artiklar i diagramkategorin.