Módulo 6 - Ciência de Dados com R

Docente responsável: Regina Bispo

Número de horas de aula - 18 Horas Teórico-Práticas + 6 horas em e-learning

Objectivos da unidade curricular:

Nesta unidade curricular pretende-se abordar competências fundamentais em data science, usando a linguagem R como uma ferramenta de apoio. Em concreto, serão abordadas metodologias orientadas para a análise estatística de dados, incluindo técnicas de análise exploratória, visualização de dados e modelação. Serão usados casos práticos para explorar diferentes metodologias, potenciando a sua aplicação em diferentes contextos reais.

Conteúdo da unidade curricular:

1. Introdução a Data Science

2. Análise exploratória e processamento de dados

2.1 Manipulação de bases de dados

2.1.1 Importação/exportação de bases de dados

2.1.2 Ordenação e filtragem

2.1.3 Seleção de subconjuntos

2.2 Limpeza de bases de dados (padronização de dados, deteção de outliers, tratamento de dados omissos)

2.3 Análise exploratória de dados (estatística descritiva e representações gráficas)

3. Modelação estatística

3.1 Regressão linear simples e múltipla. Inclusão de variáveis categóricas. Variáveis Dummy

3.2 Regressão logística

3.3 Regressão Poisson

Bibliografia recomendada:

1. Crawley, M. (2012). The R Book. John Wiley & Sons.

2. Faraway, J. J. (2006) Extending the Linear Model with R. Chapman & Hall / CRC

3. Johnson, R. and Wichern, D. W. (2007), Applied Multivariate Statistical Analysis, 6th Edition, Prentice Hall, New Jersey

4. Turkman MAA, Silva GL (2000). Modelos Lineares Generalizados - da teoria à prática. Edições SPE.