Wat is een line chart?
een lijndiagram (ook wel lijndiagram genoemd) gebruikt punten die verbonden zijn door lijnsegmenten van links naar rechts om veranderingen in waarde aan te tonen. De horizontale as toont een continue progressie, vaak die van de tijd, terwijl de verticale as rapporteert waarden voor een metriek van belang over die progressie.
het lijndiagram hierboven toont de wisselkoers tussen twee fictieve valuta ‘ s over een periode van zes maanden., Naarmate de tijd vordert van links naar rechts, punten verbinden de dagelijkse wisselkoersen. We kunnen uit de algemene helling van de lijn en zijn verticale posities lezen dat het tarief verbeterde van ongeveer 0,75 tot 0,78 tussen maart en begin April, dan geleidelijk daalde tot ongeveer 0,765 eind mei en juni.
wanneer u een lijndiagram
moet gebruiken, gebruikt u een lijndiagram wanneer u veranderingen in waarden voor een variabele (uitgezet op de verticale as) wilt benadrukken voor continue waarden van een tweede variabele (uitgezet op de horizontale)., Deze nadruk op patronen van verandering wordt verkocht door lijnsegmenten die consequent van links naar rechts bewegen en de hellingen van de lijnen die omhoog of omlaag bewegen observeren.
op de horizontale as heeft u een variabele nodig die continue waarden weergeeft met een regelmatig meetinterval. Deze variabele is een tijdelijke variabele, die elke minuut, uur, dag, week of maand een waarneming genereert. De keuze van interval grootte, of bin, is een beslissing die de analist zal meestal moeten maken voor de gegevens, in plaats van dat het een inherente data kenmerk.,
op de verticale as rapporteert u de waarde van een tweede numerieke variabele voor punten die vallen in elk van de intervallen gedefinieerd door de horizontale-as variabele. Vaak zal dit een statistische samenvatting zijn als een totale of Gemiddelde waarde over gebeurtenissen binnen elke bin.
meerdere regels kunnen ook worden uitgezet in een enkel lijndiagram om de trend tussen reeksen te vergelijken. Een algemeen gebruik hiervoor is het observeren van de uitsplitsing van de gegevens over verschillende subgroepen. De mogelijkheid om meerdere lijnen te plotten biedt ook de lijndiagram een speciaal geval waar het kan meestal niet worden geselecteerd., Normaal gesproken gebruiken we een histogram om de frequentieverdeling van een enkele numerieke variabele weer te geven. Echter, omdat het lastig is om twee histogrammen op dezelfde set assen te plotten, dient het lijndiagram als een goede manier van vergelijking als vervanging. Lijndiagrammen die worden gebruikt om frequentieverdelingen weer te geven, worden vaak frequentie polygonen genoemd.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., De waarden in de eerste kolom geven de posities aan voor punten op de horizontale as voor elke lijn die moet worden uitgezet. Elke volgende kolom geeft de verticale positie aan voor punten van een enkele lijn.
bepaalde hulpmiddelen maken lijndiagrammen van een ander gegevensformaat waarbij drie kolommen worden verwacht, ongeacht het aantal lijnen dat moet worden uitgezet. In deze gevallen specificeren de kolommen de horizontale waarden, verticale waarden en aan welke lijn aan elke rij wordt toegewezen.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., Voor tijdelijke gegevens kan een te breed meetinterval betekenen dat het te lang duurt om te zien waar de gegevenstrend leidt, waardoor het nuttige signaal wordt verborgen. Aan de andere kant van de medaille kan een te kort meetinterval alleen ruis onthullen in plaats van signaal.
het testen van verschillende intervallen of het vertrouwen op uw domein kennis over welke gegevens worden opgenomen kan u informeren over een goede keuze van bin grootte. Het kan ook mogelijk zijn om meerdere lijnen te gebruiken, met een lijn voor een fijnkorrelig interval, en vervolgens een tweede lijn voor de algemene trend, gemiddeld over een rollend venster.,
plot niet te veel lijnen
met grote macht komt grote verantwoordelijkheid, dus hoewel er de technische capaciteit is om veel lijnen op een enkele lijndiagram te zetten, is het een goed idee om verstandig te zijn in de hoeveelheid gegevens die u plot. Een goede vuistregel is om jezelf te beperken tot vijf of minder lijnen, opdat de plot uiteindelijk op zoek naar een onleesbare kluwen. Als de regels echter goed gescheiden zijn, kunt u nog steeds alle waarden plotten die u wilt volgen.,
Als u de noodzaak vindt om meer regels te plotten dan gelezen kan worden in een enkele as, dan kunt u overwegen de plots in een raster van kleinere lijndiagrammen te zetten. Het zal moeilijker zijn om details in deze percelen te zien, dus het is een goed idee om ze te sorteren op een aantal belangrijke kenmerken (zoals gemiddelde of uiteindelijke waarde) om te helpen trekken uit belangrijke punten. Als u gebruik maakt van een tool die het mogelijk maakt voor interactieve plots, een ander alternatief is om te kunnen markeren individuele lijnen of grijs lijnen te zijn uit de focus als de lezer wenst.,
vaak gebruikt
strikt gebruikmakend van een nulwaarde baseline
ondanks dat de nul baseline voor de verticale as een vereiste is voor staafdiagrammen en histogrammen, hoeft u geen nul baseline voor een lijndiagram op te nemen. Bedenk dat het belangrijkste doel van een lijndiagram is om veranderingen in waarde te benadrukken, in plaats van de grootte van de waarden zelf. In gevallen waarin een nullijn niet zinvol of nuttig is, is het prima om het verticale asbereik in te zoomen op wat de veranderingen in waarde het meest informatief maakt.,
er is echter één use case waarbij een nul baseline nog steeds nodig is. Wanneer een lijndiagram wordt gebruikt om frequentieverdelingen weer te geven, dan wordt het gebruikt in een capaciteit die gelijkwaardig is aan staafdiagrammen en histogrammen. Dus, het zal dezelfde eis van de noodzaak om een nul-waarde basislijn als anker voor de hoogte van de lijndiagram volgen.,
wanneer het lijndiagram informatie mist voor bepaalde bakken, kunnen hiaten in de record worden geïnterpreteerd als fantoomwaarden als de lijn geen afzonderlijke punten bevat bij elke waarneming. Als er niet veel punten zijn om te plotten, probeer dan alle punten te tonen en niet alleen de lijn. Als het opnemen van de punten de interpreteerbaarheid van het perceel zou vertroebelen, is een ander alternatief om een gat in de lijn op te nemen om aan te geven waar er ontbrekende waarden zijn.,
interpoleren van een curve tussen punten
In een standaard lijndiagram wordt elk punt verbonden met het volgende met een lijnsegment, van eerste naar laatste. Er kan echter de esthetische verleiding zijn om te proberen en alle punten soepel te koppelen, passend bij een curve die door alle punten tegelijk gaat. Je moet deze verleiding absoluut weerstaan! Zoals te zien is in het onderstaande voorbeeld, zal het proberen van dit soort aanpassing verzekerd zijn van het verstoren van de perceptie van trends in de gegevens., De richting en steilheid van de lijn wordt verondersteld indicatief te zijn voor verandering in waarde, en Zo kan de kromme uiteindelijk de aanwezigheid van extra gegevenspunten tussen de werkelijke metingen impliceren die niet bestaan.
met behulp van een misleidende dubbele as
voorbeelden van lijndiagrammen met meerdere regels hebben tot nu toe elke lijn deel uitgemaakt van hetzelfde domein, en dus plottable op dezelfde as. Er is echter niets dat elke regel beperkt om waarden op dezelfde eenheden weer te geven., Wanneer een lijndiagram twee reeksen bevat, die elk een samenvatting van een andere variabele afbeelden, dan eindigen we met een tweeassige plot.
het probleem met een tweeassige plot is dat het gemakkelijk kan worden gemanipuleerd om misleidend te zijn. Afhankelijk van hoe elke as wordt geschaald, kan de waargenomen relatie tussen de twee lijnen worden veranderd. Op de twee percelen hieronder wordt het aantal wekelijkse proeven en abonnementen uitgezet in percelen met twee assen. De gegevens zijn precies hetzelfde voor elke variabele, maar door de keuze van verticale schaling voor elke variabele, zal de afgeleide relatie tussen de variabelen veranderen.,
hoewel veel visualisatietools in staat zijn dubbelassige diagrammen te maken, suggereren gemeenschappelijke aanbevelingen tegen dit, ongeacht of de twee assen zich in dezelfde of afzonderlijke domeinen bevinden. In plaats daarvan maakt het facetten van de twee lijnen in afzonderlijke plots het nog steeds mogelijk dat de algemene patronen van verandering voor beide variabelen worden waargenomen, terwijl de verleidingen om ze op misleidende manieren te vergelijken worden verminderd.,
Common line chart options
omvatten extra regels om onzekerheid
weer te geven wanneer we een regel hebben die een statistisch overzicht zoals een gemiddelde of mediaan weergeeft, kunnen we ook een optie hebben om toe te voegen aan de plot om onzekerheid of variabiliteit in de gegevens op elk geplot punt weer te geven. Een manier om dit te doen is door de toevoeging van foutbalken op elk punt om standaardafwijking of een andere onzekerheidsmaat weer te geven. Een ander alternatief is om ondersteunende regels boven of onder de regel toe te voegen om bepaalde grenzen op de gegevens weer te geven., Deze regels kunnen worden weergegeven als arcering om de meest voorkomende gegevenswaarden weer te geven, zoals in het voorbeeld hieronder.
Sparkline
een speciaal geval voor het lijndiagram is de sparkline. Een sparkline is in wezen een klein lijndiagram, gebouwd om in lijn te worden gebracht met tekst of naast vele waarden in een tabel. Vanwege zijn kleine formaat, zal het geen etikettering bevatten. Statistieken kunnen naast de sparkline worden geplaatst om begin-en eindwaarden aan te geven, of misschien minimum-of maximumwaarden., Het belangrijkste punt van een sparkline is om verandering over een periode te laten zien, en wordt vaak gezien in financiële contexten.
Ridgeline-plot
een variantdiagram voor een lijndiagram met meerdere regels is het ridgeline-plot. In een ridgeline plot wordt elke lijn uitgezet op een andere as, lichtjes verticaal van elkaar verschoven. Deze lichte verschuiving kan ruimte besparen in vergelijking met een volledige faceting van percelen. Net als de sparkline worden verticale asmarkeringen meestal vermeden: het zou moeilijk zijn om die waarden op de verschillende assen af te lezen., Ridgeline plots worden voornamelijk gebruikt om veel groepen te vergelijken op hun frequentieverdeling. Dit is het meest handig wanneer een duidelijk patroon zichtbaar is wanneer de lijnen op een of andere manier geordend zijn.
staafdiagram
als de variabele die we op de horizontale as willen weergeven niet numeriek of geordend is, maar categorisch, dan moeten we een staafdiagram gebruiken in plaats van een lijndiagram. De balken in een staafdiagram worden meestal gescheiden door kleine gaten, die helpen om de discrete aard van de categorieën uitgezet benadrukken., Merk echter op dat wanneer onze horizontale as numeriek of geordend is, we niet beperkt zijn tegen het gebruik van een staafdiagram, zoals te zien is in het voorbeeld hieronder.
Dot plot
een ander grafiektype dat we kunnen gebruiken wanneer de horizontale as variabele categorisch is, is de dot plot, of Cleveland dot plot. De puntdiagram is als een lijndiagram, behalve dat er geen lijnsegmenten zijn die opeenvolgende punten verbinden., Dit gebrek aan lijnsegmenten bevrijdt de punten van hun opeenvolgende progressie, en Zo kan de volgorde van labels en punten vrij worden aangepast als een staafdiagram. Het grote voordeel van het gebruik van een staafdiagram is dat een staafdiagram, net als een lijndiagram, niet verplicht is om een nul-baseline op te nemen. Als we waarden hebben boven niveaus van een categorische variabele, maar de bijbehorende waarden hebben geen betekenisvolle nul-basislijn, dan kan de puntplot een goede optie voor het diagramtype zijn.,
Histogram
wanneer de verticale as van een lijndiagram informatie over een frequentieverdeling weergeeft, hebben we een optie om de gegevens als een histogram te visualiseren. Een van de belangrijkste voordelen van het histogram is dat de bars zijn een meer consistente weergave van de frequentie binnen elke bin. Frequentie oordelen kunnen misleidend zijn in een lijndiagram, vooral in de pieken en dalen van een distributie., Een lijndiagram heeft echter één voordeel voor het visualiseren van frequentieverdelingen: als we twee verschillende groepen moeten vergelijken, is dit erg moeilijk voor een histogram. Zoals te zien in een eerdere sectie bij het gebruik van een lijndiagram, kunnen we gewoon de lijnen van de twee groepen op dezelfde assen plotten met weinig probleem.
Dichtheidscurve
een ander alternatief voor frequentiegebaseerde lijndiagrammen is de dichtheidscurve, of kerneldichtheidsschatting (KDE)., Terwijl een lijndiagram de frequentie telt per bins in afzonderlijke punten aggregeert, aggregeert de KDE de bijdrage van elk punt op een continue manier. In een KDE draagt elk punt een kleine bundel volume bij gecentreerd rond zijn ware waarde (de titulaire kernel); de som van alle volumes geeft de uiteindelijke dichtheidscurve. Omdat er zoveel opties zijn voor de vorm van de kernel, wordt de schatting van de kerneldichtheid meestal gereserveerd voor programmatische benaderingen van datavisualisatie.,
Oppervlaktediagram
een uitbreiding van het lijndiagram omvat de toevoeging van arcering tussen de lijn en een nul-baseline, een gebieddiagram genoemd. Het gebied grafiek kan worden beschouwd als een hybride van het lijndiagram met het staafdiagram, omdat waarden kunnen worden gelezen uit niet alleen hun verticale posities, maar ook de grootte van het gearceerde gebied tussen elk punt en de basislijn.,
Connected scatter plot
als u twee reeksen waarden hebt die u wilt plotten met behulp van een lijndiagram, is een alternatief diagramtype dat u kunt gebruiken het connected scatter plot. In een standaard scatterplot vertegenwoordigen de twee assen twee variabelen van belang, en punten die op de assen zijn uitgezet, geven waarden aan voor die variabelen. Als we punten verbonden in een volgorde gespecificeerd door een derde variabele zoals tijd, krijgen we een verbonden scatter plot., Een connected scatter plot is goed voor het kijken naar niet alleen de relatie tussen twee variabelen, maar ook hoe ze veranderen in de tijd of waarden van een derde variabele.
visualisatie tools
het lijndiagram is een veelzijdig en nuttig diagramtype, en zou dus beschikbaar moeten zijn in vrijwel elk data visualisatie tool die u kiest., Standaard lijndiagrammen waarbij een of meer lijnen op een enkele as worden uitgezet, moeten gemeenschappelijk zijn, maar geavanceerde opties zoals dubbele assen zijn mogelijk niet aanwezig of vereisen extra gegevenswerk om op te zetten. De ridgeline variant is niet een gebruikelijke ingebouwde, en vereist meestal aangepaste programmering of een aangepast pakket te maken. Sparklines zijn ook niet gebruikelijk op hun eigen, en worden vaker gezien als ingebouwd als onderdeel van andere rapportage-instrumenten.
het lijndiagram is een van de vele verschillende grafiektypen die kunnen worden gebruikt voor het visualiseren van gegevens., Lees meer uit onze artikelen over essentiële grafiektypen, hoe u een type gegevensvisualisatie kunt kiezen of door de volledige verzameling artikelen in de categorie grafieken te bladeren.