Che cos’è un grafico a linee?
Un grafico a linee (noto anche come grafico a linee, grafico a linee) utilizza punti collegati da segmenti di linea da sinistra a destra per dimostrare le variazioni di valore. L’asse orizzontale rappresenta una progressione continua, spesso quella del tempo, mentre l’asse verticale riporta i valori per una metrica di interesse in quella progressione.
Il grafico a linee sopra mostra il tasso di cambio tra due valute fittizie per un periodo di sei mesi., Con il passare del tempo da sinistra a destra, i punti collegano i tassi di cambio giornalieri. Possiamo leggere dalla pendenza generale della linea e dalle sue posizioni verticali che il tasso è migliorato da circa 0,75 a 0,78 tra marzo e l’inizio di aprile, per poi scendere gradualmente a circa 0,765 a fine maggio e giugno.
Quando si dovrebbe usare un grafico a linee
Si userà un grafico a linee quando si desidera enfatizzare i cambiamenti nei valori per una variabile (tracciata sull’asse verticale) per i valori continui di una seconda variabile (tracciata sull’orizzontale)., Questa enfasi sui modelli di cambiamento viene venduta da segmenti di linea che si muovono costantemente da sinistra a destra e osservano le pendenze delle linee che si muovono verso l’alto o verso il basso.
Sull’asse orizzontale, è necessaria una variabile che rappresenti valori continui con un intervallo di misurazione regolare. Molto comunemente, questa variabile è temporale, generando un’osservazione ogni minuto, ora, giorno, settimana o mese. La scelta della dimensione dell’intervallo, o bin, è una decisione che l’analista di solito deve prendere per i dati, piuttosto che essere una caratteristica intrinseca dei dati.,
Sull’asse verticale, verrà riportato il valore di una seconda variabile numerica per i punti che rientrano in ciascuno degli intervalli definiti dalla variabile dell’asse orizzontale. Spesso, questo sarà un riepilogo statistico come un valore totale o medio tra gli eventi all’interno di ciascun bin.
È anche possibile tracciare più linee in un singolo grafico a linee per confrontare l’andamento tra le serie. Un caso d’uso comune per questo è osservare la ripartizione dei dati tra diversi sottogruppi. La possibilità di tracciare più linee fornisce anche il grafico a linee un caso d’uso speciale in cui di solito non può essere selezionato., Normalmente, useremmo un istogramma per rappresentare la distribuzione di frequenza di una singola variabile numerica. Tuttavia, poiché è difficile tracciare due istogrammi sullo stesso insieme di assi, il grafico a linee funge da buona modalità di confronto come sostituto. I grafici a linee usati per rappresentare le distribuzioni di frequenza sono spesso chiamati poligoni di frequenza.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., I valori nella prima colonna indicano le posizioni dei punti sull’asse orizzontale per ogni linea da tracciare. Ogni colonna seguente indica la posizione verticale per i punti di una singola linea.
Alcuni strumenti creano grafici a linee da un formato di dati diverso in cui sono previste tre colonne indipendentemente dal numero di righe da tracciare. In questi casi, le colonne specificano i valori orizzontali, i valori verticali e a quale riga verrà assegnata ogni riga.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., Per i dati temporali, un intervallo di misurazione troppo ampio può significare che ci vuole troppo tempo per vedere dove sta conducendo la tendenza dei dati, nascondendo il segnale utile. Il rovescio della medaglia, un intervallo di misurazione troppo breve può rivelare solo rumore piuttosto che segnale.
Testare intervalli diversi o affidarsi alla conoscenza del dominio su quali dati vengono registrati può informarti di una buona scelta di dimensioni del contenitore. Può anche essere possibile utilizzare più linee, con una linea per un intervallo a grana fine, e poi una seconda linea per la tendenza generale, facendo la media su una finestra di rotolamento.,
Non tracciare troppe linee
Con una grande potenza arriva una grande responsabilità, quindi mentre c’è la capacità tecnica di mettere molte linee su un singolo grafico a linee, è una buona idea essere giudiziosi nella quantità di dati che si tracciano. Una buona regola empirica è limitarsi a cinque o meno linee, per timore che la trama finisca per sembrare un groviglio illeggibile. Tuttavia, se le linee sono ben separate, è comunque possibile tracciare tutti i valori che si desidera tenere traccia.,
Se trovi la necessità di tracciare più linee di quelle che possono essere lette in un singolo asse, potresti considerare di sfaccettare i grafici in una griglia di grafici a linee più piccoli. Sarà più difficile vedere i dettagli in questi grafici, quindi è una buona idea ordinarli in base a alcune caratteristiche importanti (come il valore medio o finale) per aiutare a disegnare punti importanti. Se si utilizza uno strumento che consente trame interattive, un’altra alternativa è quella di essere in grado di evidenziare singole linee o linee grigie per essere fuori fuoco come il lettore desidera.,
Errori comuni
Utilizzando rigorosamente una linea di base a valore zero
Nonostante la linea di base zero per l’asse verticale sia un requisito per grafici a barre e istogrammi, non è necessario includere una linea di base zero per un grafico a linee. Ricordiamo che l’obiettivo principale di un grafico a linee è quello di enfatizzare le variazioni di valore, piuttosto che la grandezza dei valori stessi. Nei casi in cui una linea zero non è significativa o utile, va bene ingrandire l’intervallo dell’asse verticale in ciò che renderà le modifiche di valore più informative.,
Esiste tuttavia un caso d’uso in cui è ancora necessaria una linea di base zero. Quando un grafico a linee viene utilizzato per visualizzare le distribuzioni di frequenza, viene utilizzato in una capacità equivalente a grafici a barre e istogrammi. Pertanto, seguirà lo stesso requisito di dover includere una linea di base a valore zero come ancoraggio per le altezze del grafico a linee.,
Non riuscendo a identificare gli spazi irregolari tra i punti
Quando il grafico a linee mancano informazioni per alcuni bin, gli spazi vuoti nel record possono essere interpretati come valori fantasma se la linea non include punti distinti ad ogni osservazione. Quando non ci sono molti punti da tracciare, prova a mostrare tutti i punti e non solo la linea. Se includere i punti confonderebbe l’interpretabilità della trama, un’altra alternativa è includere uno spazio nella linea per mostrare dove mancano i valori.,
Interpolando una curva tra punti
In un grafico a linee standard, ogni punto è collegato al successivo con un segmento di linea retta, dal primo all’ultimo. Tuttavia, ci può essere la tentazione estetica di cercare di collegare tutti i punti senza intoppi, montaggio di una curva che passa attraverso tutti i punti in una sola volta. Dovresti assolutamente resistere a questa tentazione! Come si vede nell’esempio seguente, tentare questo tipo di adattamento sarà assicurato dalla distorsione della percezione delle tendenze nei dati., La direzione e la pendenza della linea dovrebbero essere indicativi di variazione di valore, e quindi la curva potrebbe finire per implicare la presenza di punti dati aggiuntivi tra le misurazioni effettive che non esistono.
Utilizzando un doppio asse fuorviante
Esempi di grafici a linee con più linee hanno finora avuto ogni linea essere parte dello stesso dominio, e quindi plottable sullo stesso asse. Non c’è nulla che limiti ogni riga per rappresentare valori sulle stesse unità, tuttavia., Quando un grafico a linee include due serie, ciascuna raffigurante un riepilogo di una variabile diversa, finiamo con un grafico a doppio asse.
Il problema con un grafico a doppio asse è che può essere facilmente manipolato per essere fuorviante. A seconda di come viene scalato ogni asse, la relazione percepita tra le due linee può essere modificata. Nei due grafici seguenti, il numero di prove settimanali e abbonamenti sono tracciati in grafici a doppio asse. I dati sono esattamente gli stessi per ciascuno, ma a causa della scelta del ridimensionamento verticale per ogni variabile, la relazione dedotta tra le variabili cambierà.,
Mentre molti strumenti di visualizzazione sono in grado di creare grafici a doppio asse, le raccomandazioni comuni suggeriscono contro questo, indipendentemente dal fatto che i due assi si trovino nello stesso o domini separati. Invece, sfaccettare le due linee in trame separate consente ancora di osservare i modelli generali di cambiamento per entrambe le variabili, riducendo le tentazioni di confrontarle in modi fuorvianti.,
Le opzioni comuni del grafico a linee
Includono linee aggiuntive per mostrare incertezza
Quando abbiamo una linea che raffigura un riepilogo statistico come una media o una mediana, possiamo anche avere un’opzione da aggiungere al grafico per visualizzare incertezza o variabilità nei dati in ogni punto tracciato. Un modo per farlo è attraverso l’aggiunta di barre di errore in ogni punto per mostrare la deviazione standard o qualche altra misura di incertezza. Un’altra alternativa è aggiungere linee di supporto sopra o sotto la linea per mostrare determinati limiti sui dati., Queste linee potrebbero essere renderizzate come ombreggiatura per mostrare i valori di dati più comuni, come nell’esempio seguente.
Sparkline
Un caso d’uso speciale per il grafico a linee è la sparkline. Una sparkline è essenzialmente un piccolo grafico a linee, costruito per essere messo in linea con il testo o accanto a molti valori in una tabella. A causa delle sue piccole dimensioni, non includerà alcuna etichettatura. Le statistiche possono essere posizionate accanto alla sparkline per indicare i valori iniziali e finali, o forse i valori minimi o massimi., Il punto principale di una sparkline è quello di mostrare il cambiamento per un periodo di tempo, ed è spesso visto in contesti finanziari.
Ridgeline plot
Un tipo di grafico variante per un grafico a linee con più righe è il grafico ridgeline. In una trama ridgeline, ogni linea viene tracciata su un asse diverso, leggermente sfalsata l’una dall’altra verticalmente. Questo leggero offset può risparmiare spazio rispetto a una sfaccettatura completa dei grafici. Come la sparkline, le marcature degli assi verticali sono in genere evitate: sarebbe difficile leggere quei valori sui diversi assi., I grafici di Ridgeline sono utilizzati principalmente per confrontare molti gruppi sulle loro distribuzioni di frequenza. Questo è molto utile quando un modello chiaro è visibile quando le linee sono ordinate in qualche modo.
Grafico a barre
Se la variabile che vogliamo mostrare sull’asse orizzontale non è numerica o ordinata, ma invece categorica, allora dobbiamo usare un grafico a barre invece di un grafico a linee. Le barre in un grafico a barre sono solitamente separate da piccoli spazi vuoti, che aiutano a sottolineare la natura discreta delle categorie tracciate., Nota, tuttavia, quando il nostro asse orizzontale è numerico o ordinato, non siamo limitati all’utilizzo di un grafico a barre, come mostrato nell’esempio seguente.
Dot plot
Un altro tipo di grafico che possiamo usare quando la variabile dell’asse orizzontale è categorica è il dot plot, o Cleveland dot plot. Il grafico a punti è come un grafico a linee, tranne per il fatto che non ci sono segmenti di linea che collegano punti consecutivi., Questa mancanza di segmenti di linea libera i punti dalla loro progressione sequenziale, e quindi l’ordine delle etichette e dei punti può essere regolato liberamente come un grafico a barre. Il principale vantaggio dell’utilizzo di un grafico a punti su un grafico a barre è che un grafico a punti, come un grafico a linee, non è tenuto a includere una linea di base zero. Se abbiamo valori su livelli di una variabile categoriale, ma i valori associati non hanno una linea di base zero significativa, il grafico a punti può essere una buona opzione di tipo grafico.,
Istogramma
Quando l’asse verticale di un grafico a linee raffigura informazioni su una distribuzione di frequenza, abbiamo la possibilità di visualizzare i dati come un istogramma, invece. Uno dei principali vantaggi dell’istogramma è che le barre sono una visualizzazione più coerente della frequenza all’interno di ciascun contenitore. Giudizi di frequenza possono essere fuorvianti in un grafico a linee, soprattutto nei picchi e depressioni di una distribuzione., Tuttavia, un grafico a linee ha un vantaggio per visualizzare le distribuzioni di frequenza: se abbiamo bisogno di confrontare due gruppi diversi, questo è molto difficile per un istogramma. Come visto in una sezione precedente quando si utilizza un grafico a linee, possiamo semplicemente tracciare le linee dei due gruppi sugli stessi assi con pochi problemi.
Curva di densità
Un’altra alternativa per i grafici a linee basati sulla frequenza è la curva di densità, o kernel density estimate (KDE)., Mentre un grafico a linee aggrega i conteggi di frequenza per bin in singoli punti, KDE aggrega il contributo di ciascun punto in modo continuo. In un KDE, ogni punto contribuisce con un piccolo grumo di volume centrato attorno al suo vero valore (il kernel titolare); la somma di tutti i volumi dà la curva di densità finale. Poiché ci sono così tante opzioni per la forma del kernel, la stima della densità del kernel è solitamente riservata agli approcci programmatici alla visualizzazione dei dati.,
Grafico ad area
Un’estensione al grafico a linee comporta l’aggiunta di ombreggiature tra la linea e una linea di base zero, chiamata grafico ad area. Il grafico ad area può essere considerato un ibrido del grafico a linee con il grafico a barre, poiché i valori possono essere letti non solo dalle loro posizioni verticali, ma anche dalla dimensione dell’area ombreggiata tra ogni punto e la linea di base.,
Connected scatter plot
Se hai due serie di valori che vuoi tracciare usando un grafico a linee, un tipo di grafico alternativo che puoi usare è il connected scatter plot. In un grafico a dispersione standard, i due assi rappresentano due variabili di interesse e i punti tracciati sugli assi indicano valori su tali variabili. Se abbiamo collegato i punti in un ordine specificato da una terza variabile come il tempo, otteniamo un grafico a dispersione connesso., Un grafico a dispersione connesso è utile per esaminare non solo la relazione tra due variabili, ma anche il modo in cui cambiano nel tempo o nei valori di una terza variabile.
Strumenti di visualizzazione
Il grafico a linee è un tipo di grafico versatile e utile, e quindi dovrebbe essere disponibile praticamente in qualsiasi strumento di visualizzazione dei dati scelto., I grafici a linee di base in cui una o più linee sono tracciate su un singolo asse dovrebbero essere comuni, ma le opzioni avanzate come i doppi assi potrebbero non essere presenti o richiedere ulteriori dati da configurare. La variante ridgeline non è un comune built-in, e di solito richiede la programmazione personalizzata o un pacchetto personalizzato per creare. Sparklines troppo non sono comuni da soli, e sono più spesso visti come costruito in come parte di altri strumenti di reporting.
Il grafico a linee è uno dei diversi tipi di grafico che possono essere utilizzati per la visualizzazione dei dati., Scopri di più dai nostri articoli sui tipi di grafici essenziali, su come scegliere un tipo di visualizzazione dei dati o sfogliando la raccolta completa di articoli nella categoria grafici.