ce este o diagramă linie?
o diagramă linie (aka complot linie, grafic linie) utilizează puncte conectate prin segmente de linie de la stânga la dreapta pentru a demonstra modificări în valoare. Axa orizontală prezintă o progresie continuă, adesea cea a timpului, în timp ce axa verticală raportează valori pentru o metrică de interes în această progresie.
graficul de linii de mai sus arată cursul de schimb între două monede fictive pe o perioadă de șase luni., Pe măsură ce timpul progresează de la stânga la dreapta, punctele conectează ratele de schimb zilnice. Putem citi de la general panta liniei și poziții verticale că rata a crescut de la 0,75 la 0,78 între Martie și începutul lunii aprilie, apoi a scăzut treptat de la aproximativ 0.765 la sfârșitul lunii Mai și iunie.
când ar trebui să utilizați o diagramă linie
veți utiliza o diagramă linie atunci când doriți să evidențiați modificările valorilor pentru o variabilă (reprezentată grafic pe axa verticală) pentru valorile continue ale unei a doua variabile (reprezentată grafic pe orizontală)., Acest accent pe modelele de schimbare este vândut de segmente de linie care se deplasează în mod constant de la stânga la dreapta și observând pantele liniilor care se deplasează în sus sau în jos.pe axa orizontală, aveți nevoie de o variabilă care prezintă valori continue care au un interval regulat de măsurare. Foarte frecvent, această variabilă este una temporală, generând o observație în fiecare minut, oră, zi, săptămână sau lună. Alegerea mărimii intervalului, sau bin, este o decizie pe care analistul va trebui, de obicei, să o ia pentru date, mai degrabă decât să fie o caracteristică inerentă a datelor.,
pe axa verticală, veți raporta valoarea unei a doua variabile numerice pentru punctele care se încadrează în fiecare dintre intervalele definite de variabila axei orizontale. Adesea, acesta va fi un rezumat statistic ca o valoare totală sau medie între evenimentele din fiecare coș.
Mai multe linii pot fi, de asemenea, reprezentate grafic într-o singură diagramă linie pentru a compara tendința între serii. Un caz comun de utilizare pentru aceasta este observarea defalcării datelor în diferite subgrupuri. Abilitatea de a trasa mai multe linii oferă, de asemenea, graficul liniei un caz special de utilizare în care s-ar putea să nu fie selectat de obicei., În mod normal, am folosi o histogramă pentru a descrie distribuția frecvenței unei singure variabile numerice. Cu toate acestea, deoarece este dificil să se traseze două histograme pe același set de axe, graficul liniei servește ca un mod bun de comparație ca înlocuitor. Diagramele de linii utilizate pentru a descrie distribuțiile de frecvență sunt adesea numite poligoane de frecvență.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., Valorile din prima coloană indică pozițiile punctelor de pe axa orizontală pentru fiecare linie care urmează să fie reprezentată grafic. Fiecare coloană următoare indică poziția verticală pentru punctele unei singure linii.
anumite instrumente creează diagrame de linii dintr-un format de date diferit, unde se așteaptă trei coloane, indiferent de numărul de linii de complot. În aceste cazuri, coloanele specifică valorile orizontale, valorile verticale și la care linie va fi atribuită fiecărui rând.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., Pentru datele temporale, un interval de măsurare prea larg poate însemna că durează prea mult timp pentru a vedea unde conduce tendința datelor, ascunzând semnalul util. Pe partea flip a monedei, un interval de măsurare prea scurt poate dezvălui doar zgomot, mai degrabă decât semnal.testarea diferitelor intervale sau bazându-vă pe cunoștințele dvs. de domeniu despre datele înregistrate vă poate informa despre o alegere bună a mărimii coșului. De asemenea, poate fi posibil să se utilizeze mai multe linii, cu o linie pentru un interval cu granulație fină, și apoi o a doua linie pentru tendința generală, în medie pe o fereastră de rulare.,
nu complot prea multe linii
Cu o mare putere vine mare responsabilitate, astfel încât în timp ce există capacitatea tehnică de a pune mai multe linii pe o singură diagramă linie, este o idee bună să fiți atent la cantitatea de date pe care le complot. O regulă bună este să vă limitați la cinci sau mai puține linii, ca nu cumva complotul să nu pară o încurcătură care nu poate fi citită. Cu toate acestea, dacă liniile sunt bine separate, puteți totuși să trasați toate valorile pe care doriți să le urmăriți.,
Dacă veți găsi necesitatea de a complot mai multe linii decât poate fi citit într-o singură axă, atunci s-ar putea lua în considerare fatetare parcele într-o rețea de mici diagrame linie. Va fi mai dificil să vedeți detalii în aceste parcele, așa că este o idee bună să le Sortați după unele caracteristici importante (cum ar fi valoarea medie sau finală) pentru a ajuta la extragerea punctelor importante. Dacă utilizați un instrument care permite parcele interactive, o altă alternativă este să puteți evidenția linii individuale sau linii gri pentru a fi în afara focalizării așa cum dorește cititorul.,
utilizări greșite comune
folosind strict o linie de bază cu valoare zero
în ciuda liniei de bază zero pentru axa verticală fiind o cerință pentru diagramele și Histogramele de bare, nu este necesar să includeți o linie de bază zero pentru o diagramă de linie. Reamintim că scopul principal al unei diagrame liniare este de a sublinia schimbările de valoare, mai degrabă decât magnitudinea valorilor în sine. În cazurile în care o linie zero nu este semnificativă sau utilă, este bine să măriți intervalul axei verticale în ceea ce va face modificările valorii cele mai informative.,
există un caz de utilizare în cazul în care o bază zero este încă necesară, cu toate acestea. Atunci când o diagramă linie utilizată pentru a afișa distribuții de frecvență, atunci acesta este utilizat într-o capacitate echivalentă cu diagrame de bare și histograme. Astfel, va urma aceeași cerință de a fi nevoie să includă o linie de bază cu valoare zero ca ancoră pentru înălțimile graficului de linie.,
dacă nu se identifică decalaje inegale între puncte
atunci când graficul de linii lipsește informații pentru anumite coșuri, golurile din înregistrare pot fi interpretate ca valori fantomă dacă linia nu include puncte distincte la fiecare observație. Atunci când nu există multe puncte de complot, încercați să afișați toate punctele și nu doar linia. Dacă includerea punctelor ar afecta interpretabilitatea complotului, o altă alternativă este includerea unui decalaj în linie pentru a arăta unde lipsesc valorile.,
interpolarea unei curbe între puncte
într-o diagramă linie standard, fiecare punct este conectat la următorul cu un segment de linie dreaptă, de la primul la ultimul. Cu toate acestea, poate exista tentația estetică de a încerca să legăm toate punctele fără probleme, potrivind o curbă care trece prin toate punctele simultan. Ar trebui să rezistați absolut acestei ispite! După cum se vede în exemplul de mai jos, încercarea acestui tip de montare va fi asigurată de distorsionarea percepției tendințelor din date., Direcția și abrupta liniei ar trebui să indice schimbarea valorii, astfel încât curba poate ajunge să implice prezența unor puncte de date suplimentare între măsurătorile reale care nu există.
Folosind un înșelătoare dual axis
Exemple de diagrame linie cu mai multe linii au până acum au avut, fiecare linie facă parte din același domeniu, și, astfel, plottable pe aceeași axă. Cu toate acestea, nu există nimic care să limiteze fiecare linie pentru a descrie valori pe aceleași unități., Atunci când un complot linie include două serii, fiecare reprezentând un rezumat al unei variabile diferite, atunci vom termina cu un complot axă dublă.
problema cu un complot cu două axe este că poate fi ușor manipulat pentru a fi înșelător. În funcție de modul în care fiecare axă este scalată, relația percepută dintre cele două linii poate fi modificată. În cele două parcele de mai jos, numărul de încercări săptămânale și abonamente sunt reprezentate grafic în parcele cu două axe. Datele sunt exact aceleași pentru fiecare, dar datorită alegerii scalării verticale pentru fiecare variabilă, relația dedusă între variabile se va schimba.,
deși multe instrumente de vizualizare sunt capabile să creeze diagrame cu două axe, recomandările comune sugerează împotriva acestui lucru, indiferent dacă cele două axe sunt în domenii identice sau separate. În schimb, fațetarea celor două linii în parcele separate permite în continuare observarea modelelor generale de schimbare pentru ambele variabile, reducând în același timp tentațiile de a le compara în moduri înșelătoare.,
linie Comună opțiuni grafic
Include linii suplimentare pentru a arăta incertitudine
atunci Când avem o linie care descrie un rezumat statistic ca o medie sau median, putem avea, de asemenea, o opțiune pentru a adăuga la complot pentru a afișa incertitudine sau variabilitatea datelor la fiecare trasate punct. O modalitate de a face acest lucru este prin adăugarea de bare de eroare la fiecare punct pentru a arăta abaterea standard sau o altă măsură de incertitudine. O altă alternativă este să adăugați linii de susținere deasupra sau dedesubtul liniei pentru a afișa anumite limite pe date., Aceste linii pot fi redate ca umbrire pentru a arăta cele mai comune valori de date, ca în exemplul de mai jos.
Sparkline
un caz special de utilizare pentru diagrama linie este sparkline. O sparkline este, în esență, o diagramă linie mică, construit pentru a fi pus în conformitate cu textul sau alături de multe valori într-un tabel. Datorită dimensiunilor mici, nu va include nicio etichetare. Statisticile pot fi plasate lângă sparkline pentru a indica valorile de început și de sfârșit, sau poate valori minime sau maxime., Punctul principal al unei sparkline este de a arăta schimbarea într-o perioadă de timp și este adesea văzută în contexte financiare.
Ridgeline plot
un tip de diagramă variantă pentru o diagramă linie cu mai multe linii este complot ridgeline. Într-un complot ridgeline, fiecare linie este reprezentată pe o axă diferită, ușor decalată una de cealaltă pe verticală. Această ușoară compensare poate economisi spațiu în comparație cu o fațetare completă a parcelelor. Ca și sparkline, marcajele axei verticale sunt de obicei evitate: ar fi dificil să citiți aceste valori pe diferite axe., Parcelele Ridgeline sunt utilizate în principal pentru a compara o mulțime de grupuri pe distribuțiile lor de frecvență. Acest lucru este cel mai util atunci când un model clar este vizibil atunci când liniile sunt ordonate într-un fel.
diagramă bară
dacă variabila pe care dorim să o afișăm pe axa orizontală nu este numerică sau ordonată, ci în schimb categorică, atunci trebuie să folosim o diagramă bară în loc de o diagramă linie. Barele dintr-o diagramă de bare sunt de obicei separate prin mici lacune, care ajută la evidențierea naturii discrete a categoriilor reprezentate grafic., Rețineți, totuși, când axa noastră orizontală este numerică sau ordonată, nu suntem restricționați să folosim o diagramă cu bare, așa cum se vede în exemplul de mai jos.
Dot plot
un Alt tip de diagramă putem folosi atunci când axa orizontală variabilă este categoric este dot plot, sau Cleveland punct de complot. Parcela punct este ca un complot linie, cu excepția faptului că nu există segmente de linie care leagă puncte consecutive., Această lipsă de segmente de linie eliberează punctele de progresia lor secvențială, astfel încât ordinea etichetelor și a punctelor poate fi ajustată liber ca o diagramă cu bare. Avantajul major al utilizării unui complot punct peste o diagramă de bare este că un complot punct, ca o diagramă linie, nu este obligat să includă o linie de bază zero. Dacă avem valori peste nivelurile unei variabile categorice, dar valorile asociate nu au o bază zero semnificativă, atunci graficul punct poate fi o opțiune bună de tip grafic.,
histogramă
când axa verticală a unei diagrame de linii descrie informații despre o distribuție a frecvenței, avem o opțiune de a vizualiza datele ca histogramă. Unul dintre principalele beneficii ale histogramei este că barele sunt o afișare mai consistentă a frecvenței în fiecare coș. Judecățile de frecvență pot induce în eroare într-o diagramă de linii, în special în vârfurile și jgheaburile unei distribuții., Cu toate acestea, o diagramă linie are un avantaj pentru vizualizarea distribuțiilor de frecvență: dacă trebuie să comparăm două grupuri diferite, acest lucru este foarte dificil pentru o histogramă. Așa cum se vede într-o secțiune anterioară atunci când se utilizează o diagramă linie, putem complot doar liniile celor două grupuri pe aceleași axe cu puțină problemă.
curba densității
O altă alternativă pentru diagramele de linii bazate pe frecvență este curba densității sau estimarea densității kernel-ului (KDE)., În timp ce o diagramă de linii agregă frecvența contorizată de pubele în puncte unice, KDE agregă contribuția fiecărui punct într-un mod continuu. Într-un KDE, fiecare punct contribuie cu o mică bucată de volum centrată în jurul valorii sale reale (nucleul titular); suma tuturor volumelor dă curba de densitate finală. Deoarece există atât de multe opțiuni pentru forma kernelului, estimarea densității kernelului este de obicei rezervată abordărilor programatice pentru vizualizarea datelor.,
diagramă de zonă
o extensie a diagramei de linie implică adăugarea de umbrire între linie și o linie de bază zero, numită diagramă de zonă. Diagrama de zonă poate fi considerată un hibrid al graficului de linie cu graficul de bare, deoarece valorile pot fi citite nu doar din pozițiile lor verticale, ci și din dimensiunea zonei umbrite dintre fiecare punct și linia de bază.,
Conectat scatter plot
Dacă aveți două serii de valori pe care doriți să complot folosind o diagramă linie, un alt tip de diagramă ai putea folosi este conectat scatter plot. Într-un complot scatter standard, cele două axe reprezintă două variabile de interes, iar punctele reprezentate pe axe indică valori pe acele variabile. Dacă am conectat puncte într-o ordine specificată de o a treia variabilă ca timp, obținem un complot scatter conectat., Un complot scatter conectat este bun pentru a privi nu doar relația dintre două variabile, ci și modul în care se schimbă în timp sau valorile unei a treia variabile.
instrumente de Vizualizare
diagramă linie este un versatil și util tip de diagramă, și așa ar trebui să fie disponibile în destul de mult orice instrument de vizualizare a datelor care o alegeți., Graficele de linii de bază în care una sau mai multe linii sunt reprezentate grafic pe o singură axă ar trebui să fie comune, dar este posibil ca opțiunile avansate, cum ar fi axele duble, să nu fie prezente sau să necesite lucrări suplimentare de date pentru configurare. Varianta ridgeline nu este un built-in comun și, de obicei, necesită programare personalizată sau un pachet personalizat pentru a crea. Sparklines prea nu sunt comune pe cont propriu, și sunt mai des văzute ca fiind construit în ca parte a altor instrumente de raportare.
diagrama linie este unul dintre mai multe tipuri diferite de diagrame care pot fi utilizate pentru vizualizarea datelor., Aflați mai multe din articolele noastre despre tipurile esențiale de diagrame, cum să alegeți un tip de vizualizare a datelor sau răsfoind colecția completă de articole din categoria diagrame.