Disciplina: Ciência de Dados

Área Científica:

Informática

HORAS CONTACTO:

80 Horas

NÚMERO DE ECTS:

7,5 ECTS

IDIOMA:

Português

Objetivos Gerais:

1 - Capacitar os alunos a aprender a pensar de forma independente e criativa em como recolher, processar e analisar dados para a solução de problemas colocados a priori.
2 - Introdução aos processos de ciência dos dados, suas ferramentas e tecnologias associadas.
3 - Expor os alunos aos problemas típicos da Ciência dos Dados, tais como enviesamentos (individuais e de grupo), a tortura de dados, bem como a boas práticas para os ultrapassar preservando a validade científica.
4 - Capacitar os alunos na criação de produtos de dados, de base visual e com apresentações orais informativas, suportados numa comunicação rigorosa, mas também apelativa e persuasiva.

Conteúdos / Programa:

1 - O que é a Ciência de Dados (CD)?
2 - As 6 questões e o processo da CD: descritiva, exploratória, inferencial, causal, preditiva e mecanicista.
3 - As competências típicas de um CD (ou de uma equipa).
4 - Análise descritiva de dados: abordagem exploratória, quantificação, sumarização, agregação.
5 - Inferência: estimativas, amostragem, variabilidade de populações.
6 - Modelos de regressão de dados, métodos estatísticos e predição.
7 - O desafio da Big Data: volume, velocidade e variedade.
8 - Principais tecnologias de Big Data: Map-Reduce, Hadoop, PIG, HBase, Dremel.
9 - Diferentes tipos de dados: NGrams, Exif, Genoma, Dados Temporais, Mineração de Processos.
10 - Processo de recolha, interpretação, limpeza e manipulação de dados.
11 - Metadados e evidências do percurso.
12 - Ontologias de dados e web semântica.
13 - Comunicação e Visualização de Dados.
14 - Princípios dos gráficos analíticos e propriedades visuais que captam a atenção.
15 - Hierarquia dos atributos visuais e semiótica dos gráficos.

Bibliografia / Fontes de Informação:

Freeman, M., & Ross, J. , 2018 , Programming Skills for Data Science: Start Writing Code to Wrangle, Analyze, and Visualize Data with R. Addison-Wesley Professional , Addison Wesley Data & Analytics Series
Anthony So, & Thomas V. Joseph, Robert Thas John, Andrew Worsley and Dr. Samuel Asare , 2020 , The Data Science Workshop - Second Edition , Data Science & Artificial Intelligence
EMC Education Services , 2015 , Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data , EMC Education Services
Bertin, J. , 1983 , Semiology of graphics; diagrams networks maps (No. 04; QA90, B7.) , Universty of Wisconsin

Métodos e Critérios de Avaliação:

Tipo de Classificação: Quantitativa (0-20)

Metodologia de Avaliação:
Metodologia de ensino: aulas teóricas e teórico-práticas e orientação tutorial Avaliação: 1. Componente teórica - 40% (individual): 2 Frequências - 20% + 20% 2. Componente prática - 60% (em grupos de 6 alunos) com um trabalho com duas fases - 20% + 40%: 2.1 Fase de análise e planeamento contendo o trabalho de identificação do problema, determinação da pergunta e do processo que levará à recolha de dados, processamento e comunicação. 2.2 Fase de implementação do processo e de comunicação do produto de dados criado.

Regente da Disciplina:

Duarte Paulo Brazão Gouveia