qu’est Ce qu’une ligne graphique?
un graphique linéaire (ou graphique linéaire) utilise des points reliés par des segments de droite à gauche pour montrer les changements de valeur. L’axe horizontal représente une progression continue, souvent celle du temps, tandis que l’axe vertical indique les valeurs d’une mesure d’intérêt à travers cette progression.
le graphique linéaire ci-dessus montre le taux de change entre deux monnaies fictives sur une période de six mois., Au fur et à mesure que le temps progresse de gauche à droite, les points relient les taux de change quotidiens. Nous pouvons lire de la pente générale de la ligne et de ses positions verticales que le taux s’est amélioré d’environ 0.75 à 0.78 entre Mars et début avril, puis est tombé progressivement à environ 0.765 fin mai et juin.
Quand vous devez utiliser un graphique en ligne
Vous allez utiliser une ligne graphique lorsque vous voulez mettre en évidence les changements dans les valeurs d’une variable (tracée sur l’axe vertical) pour des valeurs continues d’une deuxième variable (tracée sur l’horizontale)., Cet accent mis sur les modèles de changement est vendu par des segments de ligne se déplaçant régulièrement de gauche à droite et en observant les pentes des lignes se déplaçant vers le haut ou vers le bas.
sur l’axe horizontal, vous avez besoin d’une variable qui représente des valeurs continues qui ont un intervalle de mesure régulier. Très souvent, cette variable est une variable temporelle, générant une observation chaque minute, heure, jour, semaine ou mois. Le choix de la taille de l’intervalle, ou bin, est une décision que l’analyste devra généralement prendre pour les données, plutôt que d’être une caractéristique inhérente aux données.,
sur l’axe vertical, vous rapporterez la valeur d’une seconde variable numérique pour les points qui tombent dans chacun des intervalles définis par la variable d’axe horizontal. Souvent, il s’agit d’un résumé statistique comme une valeur totale ou moyenne pour les événements de chaque bac.
Plusieurs lignes peuvent également être tracées dans un seul graphique linéaire pour comparer la tendance entre les séries. Un cas d’utilisation courant consiste à observer la répartition des données entre différents sous-groupes. La possibilité de tracer plusieurs lignes fournit également au graphique linéaire un cas d’utilisation spécial où il peut ne pas être sélectionné., Normalement, nous utiliserions un histogramme pour représenter la distribution de fréquence d’une seule variable numérique. Cependant, comme il est difficile de tracer deux histogrammes sur le même ensemble d’axes, le graphique linéaire Sert de bon mode de comparaison en remplacement. Les graphiques linéaires utilisés pour représenter les distributions de fréquence sont souvent appelés polygones de fréquence.
Date | Guests | Subscribers |
---|---|---|
2019-05-01 | 19 | 103 |
2019-05-02 | 22 | 105 |
2019-05-03 | 20 | 98 |
2019-05-04 | 26 | 83 |
… | … | … |
To use a line chart, data often needs to be aggregated into a table with two or more columns., Les valeurs de la première colonne indiquent les positions des points sur l’axe horizontal pour chaque ligne à tracer. Chaque colonne suivante indique la position verticale des points d’une seule ligne.
certains outils créent des graphiques linéaires à partir d’un format de données différent où trois colonnes sont attendues, quel que soit le nombre de lignes à tracer. Dans ces cas, les colonnes spécifient les valeurs horizontales, les valeurs verticales et la ligne à laquelle chaque ligne sera affectée.,/th>
Best practices for using a line chart
Choose an appropriate measurement interval
An important aspect of creating a line chart is selecting the right interval or bin size., Pour les données temporelles, un intervalle de mesure trop large peut signifier qu’il faut trop de temps pour voir où la tendance des données mène, cachant ainsi le signal utile. Au revers de la médaille, un intervalle de mesure trop court peut ne révéler que du bruit plutôt que du signal.
tester différents intervalles ou s’appuyer sur vos connaissances de domaine sur les données en cours d’enregistrement peut vous informer d’un bon choix de taille de bac. Il peut également être possible d’utiliser plusieurs lignes, avec une ligne pour un intervalle à grain fin, puis une deuxième ligne pour la tendance globale, en faisant la moyenne sur une fenêtre de roulement.,
ne tracez pas trop de lignes
avec une grande puissance vient une grande responsabilité, donc bien qu’il y ait la capacité technique de mettre de nombreuses lignes sur un seul graphique linéaire, c’est une bonne idée d’être judicieux dans la quantité de données que vous tracez. Une bonne règle empirique est de vous limiter à cinq lignes ou moins, de peur que l’intrigue ne finisse par ressembler à un enchevêtrement illisible. Cependant, si les lignes sont bien séparées, vous pouvez toujours tracer toutes les valeurs que vous souhaitez suivre.,
Si vous trouvez le besoin de tracer plus de lignes que ce qui peut être lu dans un seul axe, vous pouvez envisager de facetter les tracés dans une grille de graphiques à lignes plus petits. Il sera plus difficile de voir les détails dans ces parcelles, donc c’est une bonne idée de les Trier par une caractéristique importante (comme la valeur moyenne ou finale) pour aider à tirer des points importants. Si vous utilisez un outil qui permet des tracés interactifs, une autre alternative est de pouvoir mettre en évidence des lignes individuelles ou des lignes grises pour être floues au fur et à mesure que le lecteur le souhaite.,
abus courants
en utilisant strictement une ligne de base de valeur zéro
bien que la ligne de base zéro pour l’axe vertical soit une exigence pour les graphiques à barres et les histogrammes, vous n’avez pas besoin d’inclure une ligne de base zéro pour un graphique linéaire. Rappelons que l’objectif principal d’un graphique linéaire est de souligner les changements de valeur, plutôt que l’ampleur des valeurs elles-mêmes. Dans les cas où une ligne zéro n’est pas significative ou utile, il est bon de zoomer la plage d’axe vertical dans ce qui rendra les changements de valeur les plus informatifs.,
Il existe cependant un cas d’utilisation où une ligne de base Zéro est toujours nécessaire. Lorsqu’un graphique linéaire est utilisé pour afficher les distributions de fréquence, il est utilisé dans une capacité équivalente aux graphiques à barres et aux histogrammes. Ainsi, il suivra la même exigence d’inclure une ligne de base de valeur zéro comme point d’ancrage pour les hauteurs du graphique linéaire.,
ne pas identifier les écarts inégaux entre les points
lorsque le graphique linéaire manque d’information pour certains bacs, les écarts dans l’enregistrement peuvent être interprétés comme des valeurs fantômes si la ligne n’inclut pas de points distincts à chaque observation. Quand il n’y a pas beaucoup de points à tracer, essayez de montrer tous les points, et pas seulement la ligne. Si l’inclusion des points brouillerait l’interprétabilité du tracé, une autre alternative consiste à inclure un espace dans la ligne pour montrer où il manque des valeurs.,
interpolation D’une courbe entre des points
Dans un graphique linéaire standard, chaque point est connecté au suivant par un segment de ligne droite, du premier au dernier. Cependant, il peut y avoir la tentation esthétique d’essayer de relier tous les points en douceur, en ajustant une courbe qui traverse tous les points à la fois. Vous devriez absolument résister à cette tentation! Comme on le voit dans l’exemple ci-dessous, tenter ce type d’ajustement sera assuré de fausser la perception des tendances dans les données., La direction et la pente de la ligne sont supposées indiquer un changement de valeur, de sorte que la courbe peut finir par impliquer la présence de points de données supplémentaires entre les mesures réelles qui n’existent pas.
en utilisant un double axe trompeur
des exemples de graphiques linéaires avec plusieurs lignes ont jusqu’à présent EU chaque ligne faire partie du même domaine, et donc tractable sur le même axe. Il n’y a rien qui limite chaque ligne pour représenter des valeurs sur les mêmes unités, cependant., Lorsqu’un tracé linéaire comprend deux séries, chacune représentant un résumé d’une variable différente, nous nous retrouvons avec un tracé à double axe.
le problème avec un tracé à double axe est qu’il peut facilement être manipulé pour être trompeur. Selon la façon dont chaque axe est mis à l’échelle, la relation perçue entre les deux lignes peut être modifiée. Dans les deux Graphiques ci-dessous, le nombre d’essais hebdomadaires et d’abonnements est tracé dans des graphiques à double axe. Les données sont exactement les mêmes pour chacune, mais en raison du choix de la mise à l’échelle verticale pour chaque variable, la relation inférée entre les variables changera.,
alors que de nombreux outils de visualisation sont capables de créer des graphiques à deux axes, des recommandations communes suggèrent contre cela, que les deux axes soient dans le même domaine ou dans des domaines distincts. Au lieu de cela, la facette des deux lignes dans des graphiques séparés permet toujours d’observer les schémas généraux de changement pour les deux variables, tout en réduisant les tentations de les comparer de manière trompeuse.,
options courantes du graphique linéaire
inclure des lignes supplémentaires pour montrer l’incertitude
lorsque nous avons une ligne qui représente un résumé statistique comme une moyenne ou une médiane, nous pouvons également avoir une option à ajouter au graphique pour afficher l’incertitude ou la variabilité des données à chaque point tracé. Une façon de le faire consiste à ajouter des barres d’erreur à chaque point pour montrer l’écart type ou une autre mesure d’incertitude. Une autre alternative consiste à ajouter des lignes de support au-dessus ou en dessous de la ligne pour afficher certaines limites sur les données., Ces lignes peuvent être rendues sous forme d’ombrage pour afficher les valeurs de données les plus courantes, comme dans l’exemple ci-dessous.
Sparkline
Un spécial en cas d’utilisation de la ligne graphique est le sparkline. Une sparkline est essentiellement un petit graphique linéaire, construit pour être mis en ligne avec du texte ou à côté de nombreuses valeurs dans un tableau. En raison de sa petite taille, il n’inclura aucun étiquetage. Les statistiques peuvent être placées à côté de la sparkline pour indiquer les valeurs de début et de fin, ou peut-être les valeurs minimales ou maximales., Le point principal d’une sparkline est de montrer le changement sur une période de temps, et est souvent vu dans des contextes financiers.
tracé Ridgeline
un type de graphique variant pour un graphique linéaire avec plusieurs lignes est le tracé ridgeline. Dans un tracé ridgeline, chaque ligne est tracée sur un axe différent, légèrement décalée l’une de l’autre verticalement. Ce léger décalage peut économiser de l’espace par rapport à un facettage des parcelles. Comme la sparkline, les marques d’axe vertical sont généralement évitées: il serait difficile de lire ces valeurs sur les différents axes., Les tracés Ridgeline sont principalement utilisés pour comparer de nombreux groupes sur leurs distributions de fréquence. Ceci est particulièrement utile lorsqu’un motif est visible lorsque les lignes sont ordonnées d’une certaine façon.
Barre graphique
Si la variable que nous voulons montrer sur l’axe horizontal n’est pas numérique ou commandé, mais plutôt catégorique, alors nous avons besoin d’utiliser un diagramme à barres au lieu d’une ligne graphique. Les barres d’un graphique à barres sont généralement séparées par de petits espaces, ce qui contribue à souligner la nature discrète des catégories tracées., Notez cependant que lorsque notre axe horizontal est numérique ou ordonné, nous ne sommes pas limités à l’utilisation d’un graphique à barres, comme le montre l’exemple ci-dessous.
Dot plot
un autre type de graphique que nous pouvons utiliser lorsque la variable d’axe horizontal est catégorique est le dot plot, ou Cleveland dot plot. Le tracé de points est comme un tracé de lignes, sauf qu’il n’y a pas de segments de lignes reliant des points consécutifs., Cette absence de segments de ligne libère les points de leur progression séquentielle, et ainsi l’ordre des étiquettes et des points peut être librement ajusté comme un graphique à barres. L’avantage majeur de l’utilisation d’un point, tracer sur un graphique à barres est qu’un point de l’intrigue, comme une ligne graphique, n’est pas tenu d’inclure un zéro de référence. Si nous avons des valeurs sur les niveaux d’une variable de catégorie, mais que les valeurs associées n’ont pas de ligne de base nulle significative, alors le graphique à points peut être une bonne option de type de graphique.,
Histogramme
Lors de l’axe vertical d’une ligne graphique montre les informations sur une distribution de fréquence, nous avons une option pour visualiser les données sous forme d’histogramme à la place. L’un des principaux avantages de l’histogramme est que les barres sont un affichage plus cohérent de la fréquence dans chaque bac. Les jugements de fréquence peuvent être trompeurs dans un graphique linéaire, en particulier dans les pics et les creux d’une distribution., Cependant, un graphique linéaire présente un avantage pour visualiser les distributions de fréquence: si nous devons comparer deux groupes différents, c’est très difficile pour un histogramme. Comme vu dans une section précédente lors de l’utilisation d’un graphique en courbes, nous pouvons simplement tracer les lignes des deux groupes sur les mêmes axes avec peu de problème.
courbe de densité
Une autre alternative pour les graphiques linéaires basés sur la fréquence est la courbe de densité, ou kernel density estimate (KDE)., Alors qu’un graphique linéaire agrège le nombre de fréquences par bins en points uniques, KDE agrège la contribution de chaque point de manière continue. Dans un KDE, chaque point apporte une petite masse de volume centrée autour de sa valeur réelle (le noyau titulaire); la somme de tous les volumes donne la courbe de densité finale. Comme il existe de nombreuses options pour la forme du noyau, l’estimation de la densité du noyau est généralement réservée aux approches programmatiques de la visualisation de données.,
graphique en Aires
une extension du graphique en lignes implique l’ajout d’un ombrage entre la ligne et une ligne de base zéro, appelée graphique en Aires. Le graphique en Aires peut être considéré comme un hybride du graphique linéaire avec le graphique à barres, car les valeurs peuvent être lues à partir non seulement de leurs positions verticales, mais aussi de la taille de la zone ombrée entre chaque point et la ligne de base.,
nuage de points connecté
Si vous souhaitez tracer deux séries de valeurs à l’aide d’un graphique linéaire, un autre type de graphique que vous pouvez utiliser est le nuage de points connecté. Dans un nuage de points standard, les deux axes représentent deux variables d’intérêt, et les points tracés sur les axes indiquent des valeurs sur ces variables. Si nous avons connecté des points dans un ordre spécifié par une troisième variable comme le temps, nous obtenons un nuage de points connecté., Un nuage de points connecté est bon pour regarder non seulement la relation entre deux variables, mais aussi comment elles changent dans le temps ou les valeurs d’une troisième variable.
outils de visualisation
le graphique linéaire est un type de graphique polyvalent et utile, et devrait donc être disponible dans presque tous les outils de visualisation de données que vous choisissez., Les graphiques linéaires de base où une ou plusieurs lignes sont tracées sur un seul axe doivent être courants, mais les options avancées telles que les axes doubles peuvent ne pas être présentes ou nécessiter un travail de données supplémentaire pour être configurées. La variante ridgeline n’est pas un élément commun, et nécessite généralement une programmation personnalisée ou un package personnalisé pour créer. Les Sparklines ne sont pas non plus courantes en elles-mêmes et sont plus souvent considérées comme intégrées dans le cadre d’autres outils de reporting.
le graphique linéaire est l’un des nombreux types de graphiques qui peuvent être utilisés pour visualiser des données., En savoir plus sur nos articles sur les types de graphiques essentiels, comment choisir un type de visualisation de données, ou en parcourant la collection complète d’articles dans la catégorie graphiques.