Índice:

O que são outliers na análise de dados?
O que são outliers na análise de dados?

Vídeo: O que são outliers na análise de dados?

Vídeo: O que são outliers na análise de dados?
Vídeo: O QUE SÃO E COMO TRATAR OUTLIERS 2024, Maio
Anonim

Nas estatísticas, um ponto fora da curva é um dados ponto que difere significativamente de outras observações. Um ponto fora da curva pode ser devido à variabilidade na medição ou pode indicar erro experimental; os últimos às vezes são excluídos do dados definir. Um ponto fora da curva pode causar sérios problemas em análise estatística.

Considerando isso, como você encontra outliers nos dados?

Um ponto que está fora do dados as cercas internas do set são classificadas como menores ponto fora da curva , enquanto aquele que cai fora das cercas externas é classificado como um dos principais ponto fora da curva . Para encontrar as cercas internas para o seu dados defina, primeiro, multiplique o intervalo interquartil por 1,5. Em seguida, adicione o resultado a Q3 e subtraia de Q1.

Além disso, devo remover outliers de meus dados? Para a a maior parte, se seus dados é afetado por esses casos extremos, você posso vinculado a entrada para um representante histórico de seus dados que exclui outliers . Determine caso a caso o que a efeito de os outliers era. E a partir daí, decida se você deseja retirar , mudar ou manter theoutlier valores.

Com relação a isso, como a análise de dados lida com outliers?

Aqui estão quatro abordagens:

  1. Elimine os registros atípicos. No caso de Bill Gates, ou outro verdadeiro atípico, às vezes é melhor remover completamente esse registro de seu conjunto de dados para evitar que essa pessoa ou evento distorça sua análise.
  2. Limite seus dados discrepantes.
  3. Atribua um novo valor.
  4. Experimente uma transformação.

O que é um exemplo de outlier?

Ponto fora da curva . mais Um valor que "está fora" (é muito menor ou maior que) a maioria dos outros valores em um conjunto de dados. Para exemplo nas pontuações 25, 29, 3, 32, 85, 33, 27, 28, ambos 3 e 85 são " outliers ".

Recomendado: