Existem muitos cenários na vida, em que não podemos prever o valor de uma quantidade diretamente e nesses casos usamos médias para “mostrar uma aproximação de valor”, uma tendência central.
O que é Estatística?
Estatística … é uma ciência, mais do que um ramo da matemática, aplicada de forma parametrizada, padronizada, estruturada para modelar e representar a realidade, diferentes fenômenos e contextos.
Teoria Estatística … fornece os fundamentos de métodos de análise decisões, inferências, deduções e induções estatísticas; provê mecanismos de comparar procedimentos estatísticos e alternativos; na sua maior parte, consiste em estatística matemática, teoria da probabilidade , à teoria da utilidade , e à otimização .
Teoria da Probabilidade … ramo da matemática que trata da descrição numérica da ocorrência de um evento ou se uma proposição pode ser verdadeira; a probabilidade é um numero entre 0 e 1; onde 0 é impossibilidade de ocorrência e 1 é certeza de ocorência.
Parametrização … é a aplicação da álgebra e geometria, definição e aplicação de equações, fórmulas regras, princípios, relações e comparações de variáveis, conjuntos e estatísticas; criação de variáveis secundárias à partir partir de variáveis primárias.
Padronização … na ciência da medição é a referência fundamental para o sistema de medidas para servir de comparação técnica; , baseado em consenso de empresas e governo; visa garantir a compatibilidade, interoperabilidade, segurança, repetibilidade, reprodutibilidade e qualidade .
Amostragem … seleção de subconjuntos de dados ou amostra estatística, que sejam representativas de uma população de indivíduuos e garanta qualidade, metodologia de pesquisa, para estimar as características de toda a população de indivíduos … é uma técnica de custos baixos e aplicação rápida do que trabalhar a população inteira, muitas vezes inviável.
Serve de base para fazer inferências, por:
- analogia … relações com semelhanças causais, parametrização semelhante; precisa de conformação por dedução, indução e abdução.
- dedução (inferir do geral para o específico), indução (inferir do específico para o geral) , abdução (dos efeitos para a causa).
A Estatística trata essencialmente de encontrar padrões e relacionamentos entre variáveis e gerar gráficos.
Quando plotamos pontos em um gráfico, fica mais fácil tirar conclusões sobre tendências e correlações entre as variáveis.
Isso é possível por meio da combinação de duas ideias-chave: probabilidade e inferência .
Probabilidade diz o que provavelmente acontecerá dada determinadas condições.
Inferêmcia permite generarlizar a pertir dessas observações ( probabilidades ) e fazer previsões.
Dois termos comumente confundidos na linguagem estatística são variável e parâmetro.
Média
A média serve para calcular o valor esperado da amostra, com uma determinada taxa de erro ou precisão com “apenas um número” … isso em estatística é chamado “tendência central”.
Exemplo do uso da média … ” em média nós ganhamos R$ 3,5 ” , ” em média o trem passa as 3,5 hs “, “em média a soma dos resultados de arremessos de um dado é igual a 3,5.
No entanto a média não capta as variações de valores do espaço amostral, nas várias medidas feitas, para se calcular a média.
Por exemplo, o espaço amostral, X = {1, 2, 3, 4, 5, 6}, po ser usado como um exemplo de possíveis resultados de medidas de um experimento ou de uma observação.
Pode representar valores de arremesso de um um dado, e pode ser também um exemplo “do que nós ganhamos” ou “o horário médio da pasagem do trem.
… esse é um aspecto importante da estatística … é matemática, aplicada de forma padronizada, estruturada e modelada para representar a realidade e diferentes fenômenos e contextos … serve de base para fazer diferentes tipos de inferências, por analogia (semelhanças causais), dedução (inferir do geral para o específico), indução (inferir do específico para o geral) , abdução (dos efeitos para as causas).
A média = soma dos valores ÷ nº de valores.
No conjunto {1,2,3,4,5, 6}, que pode representar um dado não viciado, a média é (1+2+3+4+5+6) / 6 = 3,5.
No entanto, o conjunto {1, 1, 2, 5, 6,6}, (1,1,1,6,6,6)
Interpretação da Média
Média é uma versão calculada e dinâmica de uma população X: soma os valores de uma amostra X e divide por sua quantidade n .
Tipifica uma amostra, msmo que não capte
Provê perspectivas para avaliar as variações sem comparar elementos par a par.
A média permite calcular a mediana e moda.
A mediana é o posicionamento da média
lcular a mediana e a moda, de uma amostra de dados.
É um indicador que permite junto com a variância ou desvio padrão (indicadores de distrinuição), identificar e categorizar variações, numa amostra de dados e o seu valor relativo.
Em outras palavras, a média só é efeitiva quando ascociado a varianâncias pequenas.
A efetividade da análise de dados e aplicação estatística da média, mediana e moda, só é efetiva quando associada ao desvio padrão da amostra.
Observar que a soma de todas as variações é sempre zero.
grupo
Media, Moda e Mediana são medidas de tendência central.
As três medidas represnetam uma amostra de dados com apenas uma valor.
Média
A média (Me) é uma “medida estatística central”, que é muito usada para representar amostras de dados, que é calculada somando-se todos os valores de um conjunto de dados e dividindo-se pelo número de elementos deste conjunto.
Por exemplo … a média do conjunto {1, 2, 3, 4, 5, 6} é (1+2+3+4+5+6) / 6 = 3,5
A média é mais efetiva e útil, quando a amostra de dados é uniforme com valores próximos (baixa variância).
É principalmente aplicada para situações onde:
- comparar diferentes quantidades de mesma categoria.
Desvantagem
Ocultar a variâncias(ou discrepâncias) dos valores da amostra.
Pouco efetiva para amostras de variância alta.
Bastante efetiva para amostras de variância baixa.
- identificar, quantificar, categorizar conjuntos.
- dar o mesmo “tratamento de valor”.
- quantificar valor de referência (categoria) para um conjunto, definir meta.
Média e Valor esperado
Valor esperado de uma variável aleatória
média e da sua relação com o valor esperado de uma variável aleatória (como por exemplo o retorno de uma ação no dia seguinte). Matematicamente, a média e o valor esperado são calculados da mesma forma, mas a interpretação é diferente.
Falamos em média quando nos referimos a algo que já aconteceu.
Falamos em valor esperado ao nos referirmos a uma variável aleatória que virá a acontecer.
No lançamento de um dado, por exemplo, que é um evento aleatório, temos seis resultados possíveis, {1, 2, 3, 4, 5}, cuja média é (1+2+3+4+5+6) / 6 = 3,5este valor é impossível como um resultado de lançamento.
A mesma coisa em finanças … quando falamos que o retorno mensal esperado de uma ação é 1%, queremos dizer que se obtivermos os retornos daquela ação por diversos meses, a média dos resultados tenderá a 1% … observe que não significa que esperamos que o retorno dessa ação no próximo mês seja 1%, já que é muito mais fácil de dar um valor diferente de 1%.
assim como JAMAIS esperamos que o próximo resultado do dado será 3,5. No caso do dado, 3,5 é um resultado impossível. Já no caso da ação, eu diria que 1% é um resultado bastante improvável, concorda? Isso porque há MUITO mais chances de um retorno diferente de 1% se realizar do que um retorno precisamente igual a 1%.
E é exatamente neste momento que entra o conceito de risco, intimamente ligado ao conceito de incerteza … só existe risco se houver incerteza.
O conceito de risco dependerá do seu objetivo, mas a sua quantificação é feita no mercado pelo desvio-padrão, que é uma medida de incerteza.
Agora imagine que o investimento tenha retorno de 1% ao mês e tenha distribuição normal …
Variável Aleatória.
Uma variável aleatória (quantitativa ou estocástica) é uma variável cujo resultado (valor) depende de fatores aleatórios, que significa a falta aparente ou real de padrão ou previsibilidade nos eventos … uma sequência aleatória de eventos, não tem ordem e não segue um padrão ou combinação inteligível.
Exemplos.
- Tempo médio de serviço.
- Tempo médio de produção.
- Tempo médio para reparo (MTTR).
- Tempo médio entre falhas (MTBF).
- Ticket médio de venda.
- Tempo médio de chegada de serviço.
- Tempo médio de espera na fila.
- Preço médio de produtos.
- Nível médio de qualidade de serviço.
- Carga de Trabalho média
Moda
Moda Mo representa o valor mais frequente da amostra de dados, ou mais provável de ser amostrado.
Assim como a média e a mediana, a moda é uma forma de expressar, em um número único, informações importantes sobre uma variável aleatória ou uma população .
Mediana
Mediana Md representa um valor central da amostra, em termos de posição e localização, após ordená-la de forma crescente ou decrescente.
- É o valor que separa a metade maior e a metade menor da amostra (ou conjunto, população,distribuição de probabilidade).
- Ex. Para o conjunto {1, 2 ,3, 4, 5} a mediana é o valor do meio, no caso 3 … para o onjunto com número par de elementos, {1,2,3,4,5,6} a mediana é a media (3 + 4) / 2, que é igual a 3,5.
Aplicações da Mediana
- Identificar distorções ou possíveis falhas de medição ou coleta de dados da amostra.
- Identificar o valor que divide a distribuição de probabilidade em duas metades iguais.
- Ignorar eventos estremos de uma amostra
- Encontrar a maioria dos dados intermediários.
Tal como a média, tem vários tipos.
Retornar a tendência central em tendências numéricas distorcidas.
Desvio Padrão
Desvio Padrão é a raiz quadrada da variância ou dispersão de uma amostra de dados em relação à sua média (valor esperado).
É uma medida estatística frequentemente usada para testar modelos e comparar dados do mundo real, variações, precisões, consistência, incerteza, risco e retorno do investimento.
Na produção … é usado em varias situações: para determinar se o peso, preço, tamanho médio de um produto, está dentro de uma faixa de tolerância.; produção precisará ser interrompida ou retardada, ou o produto precisar ser aberto, pesado ou ser usado no teste.
Em finanças … medir o risco de um determinado ativo, atrelado a flutuações de valores, preços e retorno de investimentos; avaliar a incerteza dos retornos futuros; se maior variância, incerteza e risco e avaliação de maior retorno do investimento.
Uma propriedade útil do desvio padrão é que, ao contrário da variância, ele é expresso na mesma unidade que os dados.
Depende de eventos probabilísticos, de posíveis resultados em um espaço amostral.
Um grande desvio padrão indica que os pontos de dados podem estão afastados da média e um pequeno desvio padrão indica que eles estão agrupados próximos à média.
É uma medida de incerteza.
O desvio padrão de um grupo de medições repetidas fornece a precisão dessas medições e concordância com as previsões teóricas.
Se a média das medições estiver muito longe da previsão (com a distância medida em desvios padrão), os testes precisam ser revisado, estão fora da faixa de tolerância.
Covariância