Discuta as semelhanças e diferenças entre as distribuições normal, t e f.?

semelhanças entre os dois é que, ambos levam a faixa de valores de -ve infinito a + ve infinito.

A distribuição normal tem 2 parâmetros, a média, µ e o desvio padrão, σ. Tem a forma de um sino e geralmente resulta de erros na medição de algo. Quando usado como uma distribuição de probabilidade, é difícil de integrar e as probabilidades existem em uma tabela normal padrão com µ = 0 e σ = 1.

É amplamente utilizado em muitas áreas científicas.

A distribuição t se assemelha à distribuição normal, exceto que é mais plana e mais ampla. É caracterizado pela média da amostra, Xbar, desvio padrão da amostra, s, e os graus de liberdade, n-1. Isso tem as mesmas aplicações da distribuição normal, mas é usado quando pequenas amostras (n <30) são tomadas para estimar a média de uma população quase normal.

A distribuição F é a razão de 2 variâncias, obtida de distribuições normais, e é usada para comparar 2 variâncias e, nessa capacidade, é amplamente usada em experimentos de análise de variância (ANOVA). Tem 2 parâmetros, os graus de liberdade das 2 distribuições.

Distribuição T Distribuição F

A distribuição normal é bem conhecida e usada em muitas situações diferentes. Caracterizada pela média e pela variância, a distribuição é simétrica em relação à sua média e temos um conhecimento claro da quantidade de dados contidos dentro de um número x de desvios padrão da média.

O teorema do limite central nos diz que a média e a soma de n variáveis ​​aleatórias independentes e distribuídas de forma idêntica serão aproximadamente normais quando n for grande o suficiente. Isso significa que se você tiver amostras suficientes em um conjunto de dados, você pode assumir que a média da amostra ou a soma de todos os valores é normalmente distribuída. Se os dados vêm de uma distribuição uniforme, n pode ser tão pequeno quanto 12 para que a média seja normalmente distribuída. No entanto, se os dados forem distribuídos exponencialmente, podem ser necessários vários milhares de observações antes que a média seja distribuída normalmente.

Curiosamente, a função de densidade de probabilidade, f (x) = 1 / sqrt (2 π σ²) * exp ((μ - x) ² / (2σ²)), não pode ser integrada em uma solução de forma fechada. Todos os valores da integral são encontrados numericamente.

A distribuição t de student é uma aproximação da normal padrão. A diferença entre as duas distribuições é que o normal padrão assume que você conhece a variância da população, ao passo que o aluno t considera a incerteza na medição da variância da amostra. à medida que os graus de liberdade da distribuição t de student aumentam, a distribuição t de student converge para o normal padrão, ou seja, t de student é assintoticamente normal.

se você olhar os valores do aluno t com 30 graus de liberdade, verá que os valores estão muito próximos dos valores do normal padrão. É por isso que vem a regra empírica de que você precisa de 30 amostras para assumir que a média é normalmente distribuída. No entanto, você nunca pode confiar nessa regra prática e deve sempre verificar a suposição de normalidade por meio de gráficos de probabilidade ou testes normais.

A distribuição F é definida como a razão de duas variáveis ​​aleatórias Qui-quadrado. Acontece que, se você tem uma variável aleatória normal e considera a variância como uma variável aleatória, a variância segue a distribuição qui-quadrado.

Em termos de tamanho da amostra, o Qui quadrado en -1 graus de liberdade. Então, se você tiver a variância X e a variância Y com n - 1 e m - 1 graus de liberdade respectivamente e pegar a razão W = X / Y, então você tem W seguindo a distribuição F com n -1 graus de liberdade no numerador e m - 1 grau de liberdade no denominador.

A distribuição F é usada para testar se duas variâncias são iguais. No entanto, este teste não é muito confiável e extremamente sensível à suposição de normalidade.

A distribuição F também é usada em Análise de Variância e Análise de Covariância. Qualquer análise de modelos lineares gerais usará a distribuição F também para determinar quais fatores e / ou interações no modelo são significativos.

Declare a aplicabilidade dessas distribuições em diferentes situações. Estou tendo problemas com estatísticas descritivas. Alguém poderia explicar / ajudar com isso?