Introdução à Inferência Estatística
O que é Inferência Estatística?
A inferência estatística é um ramo da estatística que se concentra em tirar conclusões sobre uma população com base em dados coletados de uma amostra.
Em outras palavras, é o processo de generalizar resultados de uma amostra para uma população maior.
Importância da Inferência Estatística
Pesquisa
Ajuda a testar hipóteses e descobrir novas informações.
Tomada de Decisões
Fornece insights para decisões mais informadas e eficazes.
Previsões
Permite fazer previsões sobre eventos futuros.
População vs. Amostra
População
É o conjunto completo de indivíduos ou objetos de interesse para um estudo.
Amostra
É um subconjunto da população que é selecionado para representar o todo.
Parâmetros e Estimadores
Parâmetros
São medidas que descrevem uma característica da população.
Estimadores
São medidas calculadas a partir da amostra para estimar os parâmetros da população.
Tipos de Amostragem

1

Amostragem aleatória simples.

2

Amostragem estratificada.

3

Amostragem por conglomerados.

4

Amostragem sistemática.
Distribuições Amostrais
A distribuição amostral descreve a distribuição de um estimador para uma amostra.
Distribuição Normal
A distribuição normal é uma das distribuições mais importantes em estatística.
Muitos fenômenos naturais seguem essa distribuição.
Teorema do Limite Central
O teorema do limite central afirma que a distribuição amostral da média de uma amostra se aproxima de uma distribuição normal à medida que o tamanho da amostra aumenta.
Intervalos de Confiança
Um intervalo de confiança é uma faixa de valores que provavelmente contém o parâmetro da população.
Nível de Confiança e Nível de Significância
Nível de Confiança
É a probabilidade de que o intervalo de confiança contenha o parâmetro da população.
Nível de Significância
É a probabilidade de rejeitar a hipótese nula quando ela é verdadeira.
Margem de Erro
A margem de erro representa a metade do intervalo de confiança. Ela indica a precisão da estimativa.
Tamanho da Amostra
O tamanho da amostra é crucial para a precisão da inferência estatística.
Intervalo de Confiança para a Média (σ conhecido)
Quando o desvio padrão da população é conhecido, podemos usar a distribuição normal para calcular o intervalo de confiança.
Intervalo de Confiança para a Média (σ desconhecido)
Quando o desvio padrão da população é desconhecido, podemos usar a distribuição t de Student.
Intervalo de Confiança para a Proporção
O intervalo de confiança para a proporção é usado para estimar a proporção da população que possui uma determinada característica.
Intervalo de Confiança para a Variância
O intervalo de confiança para a variância é usado para estimar a variabilidade dos dados da população.
Testes de Hipóteses
Testes de hipóteses são usados para avaliar se há evidências suficientes para rejeitar uma hipótese nula.
Hipótese Nula e Hipótese Alternativa
Hipótese Nula
É a hipótese que queremos testar.
Hipótese Alternativa
É a hipótese que aceitamos se a hipótese nula for rejeitada.
Erros Tipo I e Tipo II
Erro Tipo I
Rejeitar a hipótese nula quando ela é verdadeira.
Erro Tipo II
Aceitar a hipótese nula quando ela é falsa.
Poder do Teste
O poder do teste é a probabilidade de rejeitar a hipótese nula quando ela é falsa.
Teste Z para a Média (σ conhecido)
O teste Z é usado para testar a média da população quando o desvio padrão da população é conhecido.
Teste t de Student para a Média (σ desconhecido)
O teste t de Student é usado para testar a média da população quando o desvio padrão da população é desconhecido.
Teste para a Proporção
O teste para a proporção é usado para testar a proporção da população que possui uma determinada característica.
Teste Qui-Quadrado
O teste qui-quadrado é usado para testar a independência entre duas variáveis categóricas.
Teste F para Comparação de Variâncias
O teste F é usado para comparar as variâncias de duas populações.
Análise de Variância (ANOVA)
A análise de variância (ANOVA) é usada para comparar as médias de duas ou mais populações.
Regressão Linear Simples
A regressão linear simples é usada para modelar a relação linear entre duas variáveis.
Coeficiente de Correlação de Pearson
O coeficiente de correlação de Pearson mede a força e a direção da relação linear entre duas variáveis.
Coeficiente de Determinação (R²)
O coeficiente de determinação (R²) indica a proporção da variabilidade na variável dependente que é explicada pela variável independente.
Regressão Linear Múltipla
A regressão linear múltipla é usada para modelar a relação linear entre uma variável dependente e duas ou mais variáveis independentes.
Análise de Resíduos
A análise de resíduos é usada para avaliar se os pressupostos da regressão linear são satisfeitos.
Multicolinearidade
Multicolinearidade ocorre quando duas ou mais variáveis independentes estão altamente correlacionadas.
Heteroscedasticidade
Heteroscedasticidade ocorre quando a variância dos resíduos não é constante ao longo do intervalo dos valores previstos.
Autocorrelação
Autocorrelação ocorre quando os resíduos de um modelo de regressão estão correlacionados no tempo.
Métodos Não-Paramétricos
Métodos não-paramétricos são usados quando os pressupostos de testes paramétricos não são satisfeitos.
Teste de Wilcoxon
O teste de Wilcoxon é usado para comparar as médias de dois grupos independentes quando os dados não são normalmente distribuídos.
Teste de Mann-Whitney
O teste de Mann-Whitney é usado para comparar as médias de dois grupos independentes quando os dados não são normalmente distribuídos.
Teste de Kruskal-Wallis
O teste de Kruskal-Wallis é usado para comparar as médias de três ou mais grupos independentes quando os dados não são normalmente distribuídos.
Coeficiente de Correlação de Spearman
O coeficiente de correlação de Spearman mede a força e a direção da relação monotônica entre duas variáveis.
Bootstrap
O bootstrap é um método de reamostragem que permite estimar a distribuição amostral de um estimador.
Jackknife
O jackknife é um método de reamostragem que permite estimar o viés e a variância de um estimador.
Métodos Bayesianos
Os métodos Bayesianos usam a informação a priori para atualizar as crenças sobre um parâmetro da população.
Teorema de Bayes
O teorema de Bayes fornece uma fórmula para calcular a probabilidade posterior de um evento com base na informação a priori e nos dados observados.
Distribuições a Priori e a Posteriori
Distribuição a Priori
É a crença inicial sobre o parâmetro da população antes de observar os dados.
Distribuição a Posteriori
É a crença atualizada sobre o parâmetro da população após observar os dados.
Inferência Bayesiana vs. Frequentista
Inferência Bayesiana
Usa informação a priori para atualizar as crenças sobre o parâmetro da população.
Inferência Frequentista
Usa frequências amostrais para fazer inferências sobre o parâmetro da população.
Análise de Séries Temporais
A análise de séries temporais é usada para analisar dados coletados ao longo do tempo.
Modelos ARIMA
Os modelos ARIMA são usados para modelar séries temporais que exibem autocorrelação e estacionariedade.
Métodos de Previsão
Métodos de previsão são usados para prever valores futuros de uma série temporal.
Aplicações da Inferência Estatística
A inferência estatística tem inúmeras aplicações em diversas áreas, como saúde, finanças, engenharia e ciências sociais.