Disciplina: Ciência de Dados
Área Científica:
Informática
HORAS CONTACTO:
80 Horas
NÚMERO DE ECTS:
7,5 ECTS
IDIOMA:
Inglês
Objetivos Gerais:
                                         1 - Capacitar os alunos a aprender a pensar de forma independente e criativa em como recolher, processar e analisar dados para a solução de problemas colocados a priori.
 2 - Introdução aos processos de ciência dos dados, suas ferramentas e tecnologias associadas.
 3 - Capacitar os alunos no desenvolvimento completo de abordagens de aprendizagem automática, com e sem supervisão, incluindo técnicas de combinação de modelos.
 4 - Capacitar os alunos na criação de produtos de dados, de base visual e com apresentações orais informativas, suportados numa comunicação rigorosa, mas também apelativa e persuasiva.
                                    
Conteúdos / Programa:
 1 - O que é a ciência de dados e o processo de descoberta de informação - formulação de questões
 2 - Aquisição e armazenamento de dados
 3 - Análise exploratória de dados e visualização
 4 - Pré-processamento de dados, redução da dimensão e balanceamento
 5 - Extração e seleção de características
 6 - Classificação e regressão com aprendizagem supervisionada: algoritmos de treino, sobre-ajustamento e validação cruzada
 7 - Combinação de modelos com boosting e bagging
 8 - Avaliação de desempenho com métricas, gráficos e análise de significância
 9 - Algoritmos de aprendizagem não supervisionada
 10 - Estudos de casos com séries temporais, processamento de imagem e mineração de texto.
Bibliografia / Fontes de Informação:
                                         EMC Education Services , 2015 , Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data , Wiley
 William McKinney , 2022 , Python for Data Analysis 3e: Data Wrangling with pandas, NumPy, and Jupyter , O'Reilly
 Joe Reis,  Matt Housley , 2022 , Fundamentals of Data Engineering: Plan and Build Robust Data Systems , O'Reilly
                                    
Métodos e Critérios de Avaliação:
                                        Tipo de Classificação: Quantitativa (0-20)
Metodologia de Avaliação:
Metodologia de ensino: aulas teóricas e teórico-práticas e orientação tutorial. Avaliação: 1. Componente teórica - 40% (individual): 2 Frequências - 20% + 20% (nota mínima de 8 valores em cada frequências); 2. Componente prática - 60% (em grupos de 3 alunos) com dois trabalhos - 25% + 35% (nota mínima de 8 valores em cada trabalho); 2.1 Primeiro trabalho relativo à análise de dados; 2.2 Segundo trabalho relativo ao planeamento e desenvolvimento de modelos de aprendizagem automática.