What is a line chart?

um gráfico de linhas (também conhecido por Gráfico de linhas, gráfico de linhas) usa pontos ligados por segmentos de linhas da esquerda para a direita para demonstrar alterações no valor. O eixo horizontal mostra uma progressão contínua, muitas vezes a do tempo, enquanto o eixo vertical relata valores para uma métrica de interesse ao longo dessa progressão.

o gráfico de linhas acima mostra a taxa de câmbio entre duas moedas fictícias durante um período de seis meses., À medida que o tempo passa da esquerda para a direita, os pontos ligam as taxas de câmbio diárias. Podemos ler a partir da inclinação geral da linha e suas posições verticais que a taxa melhorou de cerca de 0,75 para 0,78 entre março e início de abril, em seguida, caiu gradualmente para cerca de 0,765 no final de Maio e junho.

quando deverá usar um gráfico de linhas

irá usar um gráfico de linhas quando quiser realçar as alterações nos valores de uma variável (plotada no eixo vertical) para valores contínuos de uma segunda variável (plotada na horizontal)., Esta ênfase nos padrões de mudança é vendida por segmentos de linha que se movem consistentemente da esquerda para a direita e observando as encostas das linhas que se movem para cima ou para baixo.

no eixo horizontal, você precisa de uma variável que retrata valores contínuos que têm um intervalo regular de medição. Muito comumente, esta variável é temporal, gerando uma observação a cada minuto, hora, dia, semana ou mês. A escolha do tamanho do intervalo, ou bin, é uma decisão que o analista geralmente precisa fazer para os dados, em vez de ser uma característica inerente dos dados.,

no eixo vertical, você irá relatar o valor de uma segunda variável numérica para os pontos que caem em cada um dos intervalos definidos pela variável eixo horizontal. Muitas vezes, este será um resumo estatístico como um valor total ou médio através de eventos dentro de cada caixa.

múltiplas linhas também podem ser plotadas em um gráfico de uma única linha para comparar a tendência entre as séries. Um caso de uso comum para isso é observar a desagregação dos dados em diferentes subgrupos. A capacidade de plotar várias linhas também fornece ao gráfico de linhas um caso de uso especial onde ele não pode geralmente ser selecionado., Normalmente, usaríamos um histograma para descrever a distribuição de frequência de uma única variável numérica. No entanto, como é difícil traçar dois histogramas no mesmo conjunto de eixos, o gráfico de linhas serve como um bom modo de comparação como um substituto. Gráficos de linhas usados para descrever distribuições de frequência são muitas vezes chamados de polígonos de frequência.

esta linha mostra que existem muitas mais viagens de assinante do que os hóspedes, mas os hóspedes tendem a ter viagens mais longas em média.,ure

Date Guests Subscribers
2019-05-01 19 103
2019-05-02 22 105
2019-05-03 20 98
2019-05-04 26 83

To use a line chart, data often needs to be aggregated into a table with two or more columns., Os valores na primeira coluna indicam as posições dos pontos no eixo horizontal para cada linha a traçar. Cada coluna seguinte indica a posição vertical para os pontos de uma única linha.

certas ferramentas criam gráficos de linhas a partir de um formato de dados diferente, onde são esperadas três colunas, independentemente de quantas linhas desenhar. Nestes casos, as colunas especificam os valores horizontais, os valores verticais e a que Linha de cada linha será atribuída.,/th>

2019-03-01 Guest 23 2019-03-01 Subscriber 102 2019-03-02 Guest 24 2019-03-03 Subscriber 77 … … …

Best practices for using a line chart

Choose an appropriate measurement interval

An important aspect of creating a line chart is selecting the right interval or bin size., Para os dados temporais, um intervalo de medição muito amplo pode significar que leva muito tempo para ver onde a tendência dos dados está levando, escondendo o sinal útil. Na outra face da moeda, um intervalo de medição demasiado curto só pode revelar ruído em vez de sinal.

testar diferentes intervalos ou confiar no seu conhecimento do domínio sobre os dados que estão a ser gravados pode informá-lo de uma boa escolha de tamanho do bin. Também pode ser possível usar várias linhas, com uma linha para um intervalo de granulado fino, e, em seguida, uma segunda linha para a tendência geral, em média sobre uma janela de rolamento.,

não trama muitas linhas

Com grande poder vem grande responsabilidade, por isso, enquanto não há capacidade técnica para colocar várias linhas em um único gráfico de linha, é uma boa idéia para ser criteriosos na quantidade de dados que você enredo. Uma boa regra é limitar-se a cinco ou menos linhas, para que a trama não acabe parecendo uma confusão ilegível. No entanto, se as linhas estiverem bem separadas, você ainda pode traçar todos os valores que deseja seguir.,

Se você encontrar a necessidade de traçar mais linhas do que pode ser lido em um único eixo, então você pode considerar facetar os gráficos em uma grade de gráficos de linhas menores. Será mais difícil ver detalhes nestes lotes, por isso é uma boa ideia classificá-los por alguma característica importante (como valor médio ou final) para ajudar a desenhar pontos importantes. Se você está usando uma ferramenta que permite gráficos interativos, outra alternativa é ser capaz de destacar linhas individuais ou linhas cinzentas para estar fora de foco como o leitor deseja.,

misuses comuns

estritamente usando uma linha de base de valor zero

apesar da linha de base zero para o eixo vertical ser um requisito para gráficos de barras e histogramas, não precisa de incluir uma linha de base zero para um gráfico de linhas. Lembre-se que o principal objetivo de um gráfico de linhas é enfatizar mudanças de valor, em vez da magnitude dos próprios valores. Nos casos em que uma linha zero não é significativa ou útil, é bom ampliar o intervalo de eixo vertical para o que fará com que as mudanças de valor sejam mais informativas.,

Quando um gráfico de linhas está sendo usado para exibir distribuições de frequência, então ele está sendo usado em uma capacidade equivalente a gráficos de barras e histogramas. Assim, ele seguirá o mesmo requisito de necessidade de incluir uma linha de base de valor zero como uma âncora para as alturas do Gráfico de linha.,se a linha não incluir pontos distintos em cada observação, as lacunas no registo podem ser interpretadas como valores fantasmas. Quando não há muitos pontos para plotar, tente mostrar todos os pontos e não apenas a linha. Se incluir os pontos complicar a interpretação da parcela, outra alternativa é incluir uma lacuna na linha para mostrar onde faltam os valores.,

interpolar uma curva entre pontos

numa carta de linhas padrão, cada ponto é ligado ao seguinte com um segmento de linhas rectas, do primeiro ao último. No entanto, pode haver a tentação estética de tentar ligar todos os pontos suavemente, encaixando uma curva que passa por todos os pontos de uma vez. Você deve absolutamente resistir a esta tentação! Como se vê no exemplo abaixo, tentar este tipo de ajuste será assegurado da percepção distorcida das tendências nos dados., A direção e a inclinação da linha devem ser indicativas de mudança de valor, e assim a curva pode acabar implicando a presença de pontos de dados adicionais entre as medições reais que não existem.

Usando um enganador dual axis

Exemplos de gráficos de linha, com várias linhas, até agora, tinha cada linha ser parte do mesmo domínio, e, portanto, plottable no mesmo eixo. No entanto, não há nada que limite cada linha a descrever valores nas mesmas unidades., Quando um enredo de linha inclui duas séries, cada uma representando um resumo de uma variável diferente, então acabamos com um enredo de eixo duplo.

O problema com uma parcela de eixo duplo é que ela pode ser facilmente manipulada para ser enganosa. Dependendo de como cada eixo é dimensionado, a relação percebida entre as duas linhas pode ser alterada. Nas duas parcelas abaixo, o número de ensaios semanais e subscrições são plotados em parcelas de eixo duplo. Os dados são exatamente os mesmos para cada uma, mas devido à escolha da escala vertical para cada variável, a relação inferida entre as variáveis irá mudar.,

Enquanto muitas ferramentas de visualização são capazes de criar dois eixos de gráficos, comum as recomendações sugerem contra isso, independentemente de se os dois eixos estão no mesmo ou em domínios separados. Em vez disso, facetamento as duas linhas em parcelas separadas ainda permite que os padrões gerais de mudança a ser observado para ambas as variáveis, reduzindo as tentações para compará-las no enganosas maneiras.,

Common linha de opções de gráfico

Incluir linhas adicionais para mostrar incerteza

Quando temos uma linha que mostra um resumo estatístico como uma média ou mediana, podemos também tem uma opção para adicionar o enredo para apresentar a incerteza ou variabilidade dos dados em cada um dos pontos traçados. Uma maneira de fazer isso é através da adição de barras de erro em cada ponto para mostrar o desvio padrão ou alguma outra medida de incerteza. Outra alternativa é adicionar linhas de suporte acima ou abaixo da linha para mostrar certos limites nos dados., Estas linhas podem ser renderizadas como sombreamento para mostrar os valores de dados mais comuns, como no exemplo abaixo.

Sparkline

um caso de Utilização especial para o gráfico de linha é a sparkline. Um sparkline é essencialmente um pequeno gráfico de linhas, construído para ser colocado em linha com texto ou ao lado de muitos valores em uma tabela. Devido ao seu pequeno tamanho, não irá incluir nenhuma rotulagem. As estatísticas podem ser colocadas ao lado da linha de faísca para indicar valores iniciais e finais, ou talvez valores mínimos ou máximos., O ponto principal de um sparkline é mostrar a mudança ao longo de um período de tempo, e é frequentemente visto em contextos financeiros.

Ridgeline plot

uma variante de gráfico para um gráfico de linhas com várias linhas é o gráfico de ridgeline. Em um plano de Cordilheira, cada linha é plotada em um eixo diferente, ligeiramente deslocados um do outro verticalmente. Este ligeiro deslocamento pode economizar no espaço em comparação com uma faceta completa de parcelas. Tal como a linha de faísca, as marcações verticais do eixo são tipicamente eschewed: seria difícil ler esses valores nos diferentes eixos., Os gráficos Ridgeline são usados principalmente para comparar muitos grupos em suas distribuições de frequência. Isto é mais útil quando um padrão claro é visível quando as linhas são ordenadas de alguma forma.

gráfico de Barras

Se a variável que queremos mostrar no eixo horizontal não é numérico ou encomendados, mas em vez de categoria, então precisamos usar um gráfico de barras, em vez de um gráfico de linha. As barras em um gráfico de barras são geralmente separadas por pequenas aberturas, que ajudam a enfatizar a natureza discreta das categorias plotadas., Nota, no entanto, quando nosso eixo horizontal é numérico ou ordenado, não estamos restritos contra o uso de um gráfico de barras, como visto no exemplo abaixo.

Left: Bar chart over categorical groups. Certo: Gráfico de barras sobre grupos temporais.

Dot plot

outro tipo de gráfico que podemos usar quando a variável do eixo horizontal é categórica é o ponto plot, ou Cleveland dot plot. A parcela dot é como uma parcela de linha, exceto que não há segmentos de linha conectando pontos consecutivos., Esta falta de segmentos de linha libera os pontos de sua progressão sequencial, e assim a ordem de rótulos e pontos pode ser livremente ajustado como um gráfico de barras. A principal vantagem de usar um gráfico de pontos sobre um gráfico de barras é que um gráfico de pontos, como um gráfico de linhas, não é obrigado a incluir uma linha de base zero. Se temos valores sobre níveis de uma variável categórica, mas valores associados não têm uma linha de base zero significativa, então o gráfico ponto pode ser uma boa opção de tipo gráfico.,

Histograma

Quando o eixo vertical de um gráfico de linhas mostra informações sobre uma distribuição de freqüência, temos uma opção para visualizar os dados como um histograma em vez disso. Um dos principais benefícios do histograma é que as barras são uma exibição mais consistente de frequência dentro de cada caixa. Os julgamentos de frequência podem ser enganadores em um gráfico de linhas, especialmente nos picos e fendas de uma distribuição., No entanto, um gráfico de linhas tem uma vantagem para visualizar distribuições de frequência: se precisamos comparar dois grupos diferentes, isso é muito difícil para um histograma. Como visto em uma seção anterior ao usar um gráfico de linhas, podemos apenas plotar as linhas dos dois grupos nos mesmos eixos com pouco problema.

curva de densidade

outra alternativa para gráficos de linhas baseados em frequência é a curva de densidade, ou estimativa de densidade do núcleo (KDE)., Enquanto um gráfico de linhas agrega as contagens de frequência dos contentores em pontos únicos, o KDE agrega a contribuição de cada ponto de uma forma contínua. Num KDE, cada ponto contribui com um pequeno volume centrado em torno do seu valor verdadeiro (o kernel titular); a soma de todos os volumes dá a curva de densidade final. Uma vez que existem tantas opções para a forma do kernel, a estimativa da densidade do kernel é geralmente reservada para abordagens programáticas para visualização de dados.,

gráfico de Área

Uma extensão para o gráfico de linha envolve a adição de sombreamento entre a linha zero linha de base, chamado de gráfico de área. O gráfico de área pode ser considerado um híbrido do Gráfico de linhas com o gráfico de barras, uma vez que os valores podem ser lidos não apenas a partir de suas posições verticais, mas também o tamanho da área sombreada entre cada ponto e a linha de base.,

gráfico de dispersão ligado

Se tiver duas séries de valores que deseja desenhar com um gráfico de linhas, um tipo de gráfico alternativo que poderá usar é o gráfico de dispersão ligado. Em um gráfico de dispersão padrão, os dois eixos representam duas variáveis de interesse, e pontos plotados nos eixos indicam valores nessas variáveis. Se nós conectamos pontos em uma ordem especificada por uma terceira variável como o tempo, nós obtemos um gráfico de dispersão conectado., Um gráfico de dispersão conectado é bom para olhar não apenas a relação entre duas variáveis, mas também como elas mudam ao longo do tempo ou valores de uma terceira variável.

a parcela de dispersão conectada (inferior direita) é uma combinação de dois gráficos de linhas (superior direita, inferior esquerda). Repare nos eixos trocados para o gráfico superior direito.

ferramentas de Visualização

O gráfico de linha é um versátil e útil tipo de gráfico e, portanto, devem estar disponíveis em praticamente qualquer ferramenta de visualização de dados que você escolher., Os gráficos básicos de linhas em que uma ou mais linhas são traçadas em um único eixo devem ser comuns, mas Opções avançadas como eixos duplos podem não estar presentes ou exigir o trabalho de dados adicionais para configurar. A variante ridgeline não é um embutido comum, e geralmente requer programação personalizada ou um pacote personalizado para criar. As linhas de ignição também não são comuns por si só, e são mais frequentemente vistas como construídas como parte de outras ferramentas de comunicação.

o gráfico de linhas é um dos muitos tipos de gráficos diferentes que podem ser usados para visualizar dados., Saiba mais sobre nossos artigos sobre tipos essenciais de gráficos, como escolher um tipo de visualização de dados, ou navegando a coleção completa de artigos na categoria de gráficos.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *