• Docente responsável: Regina Bispo
• Número de horas de aula - 18 Horas Teórico-Práticas + 6 horas em e-learning
Objectivos da unidade curricular:
Nesta unidade curricular pretende-se abordar competências fundamentais em data science, usando a linguagem R como uma ferramenta de apoio. Em concreto, serão abordadas metodologias orientadas para a análise estatística de dados, incluindo técnicas de análise exploratória, visualização de dados e modelação. Serão usados casos práticos para explorar diferentes metodologias, potenciando a sua aplicação em diferentes contextos reais.
Conteúdo da unidade curricular:
1. Introdução a Data Science
2. Análise exploratória e processamento de dados
2.1 Manipulação de bases de dados
2.1.1 Importação/exportação de bases de dados
2.1.2 Ordenação e filtragem
2.1.3 Seleção de subconjuntos
2.2 Limpeza de bases de dados (padronização de dados, deteção de outliers, tratamento de dados omissos)
2.3 Análise exploratória de dados (estatística descritiva e representações gráficas)
3. Modelação estatística
3.1 Regressão linear simples e múltipla. Inclusão de variáveis categóricas. Variáveis Dummy
3.2 Regressão logística
3.3 Regressão Poisson
Bibliografia recomendada:
1. Crawley, M. (2012). The R Book. John Wiley & Sons.
2. Faraway, J. J. (2006) Extending the Linear Model with R. Chapman & Hall / CRC
3. Johnson, R. and Wichern, D. W. (2007), Applied Multivariate Statistical Analysis, 6th Edition, Prentice Hall, New Jersey
4. Turkman MAA, Silva GL (2000). Modelos Lineares Generalizados - da teoria à prática. Edições SPE.