Mineração de Dados

Prof. Ronaldo Cristiano Prati

ronaldo.prati@ufabc.edu.br


Avisos


Aulas


Atendimento


Ementa da disciplina

Introdução aos conceitos do processo de descoberta de conhecimento. Técnicas de preparação de dados. Técnicas de redução dedados. Tarefas e técnicas de mineração de dados: classificação, regressão,detecção de agrupamentos, descoberta de regras de associação, sumarização, modelagem de dependências, detecção de tendências e exceções. Conceitos e técnicas de visualização de dados. Mineração dedados visuais. Exemplos de mineração de dados em domínios específicos, tais como: bioinformática, sistemas de informação geográfica, bases dedados de imagens, bases de dados de documentos textuais, bases de dados multimídia, sistemas Web, bases de dados espaço-temporais, sistemas baseados em data streams. Ferramentas de mineração de dados.


Bibliografia:

  1. HAN, J.; KAMBER, M. Data Mining - Concepts and Techniques. Morgan Kaufmann Publishers, 2001. ISBN 1558604898.
  2. HAND, D.J.; MANNILA, H.; SMYTH, P. Principles of Data Mining.Cambridge. MA: MIT Press, 2001.
  3. WITTEN,I. H.; FRANK, E. Data Mining: Practical Machine Learning Tools and Techniques, 2nd edition. Morgan Kaufmann, 2005. ISBN 0120884070.
  4. FAYYAD, U.M.; PIATETSKY-SHAPIRO, G.; SMYTH, P.; UTHURUSAMY, R.Advances in Knowledge Discovery and Data Mining. Cambridge, MA: MITPress, 1996. ISBN 0262560976.
  5. KANTARDZIC, M.; ZURADA, J. Next Generation of Data Mining Applications. Wiley-IEEE Press, 2005. ISBN 0471656054.
  6. Dunham, M. H. Data Mining Introductory and Advanced Topics. Prentice Hall/Pearson Education, 2003. ISBN 0130888923.
  7. REZENDE, S.O. Sistemas Inteligentes: Fundamentos e Aplicações.Monole

Cronograma

Aula Data Tópicos
Semana 1 02/02 [Slides][Vídeo]Introdução aos conceitos do processo de descoberta de conhecimento.
Semana 1 05/02 [Slides][Vídeo]Principais Características dos Dados
Semana 2 09/02 [Slides][Vídeo]Análise Exploratória dos Dados e Estimação de Densidade
Semana 2 12/02 [Colab Notebook][Vídeo]Análise Exploratória dos Dados com Python/Pandas
Semana 3 18/02 [Slides][Vídeo] Medidas de Similaridade e Escalonamento Multidimensional
Semana 4 23/02 [Slides][Vídeo] Examinando Relações nos Dados
Semana 4 26/02 [Colab Notebook][Vídeo] Distâncias e Associações com Python
Semana 5 02/03 [Slides][Vídeo] Classificação - Introdução
Semana 5 05/03 [Slides][Vídeo] Classificação - Classificadores Bayesianos
Semana 6 09/03 [Slides][Vídeo] Classificação - Avaliação de Classificadores
Semana 6 12/03 [Colab Notebook][Vídeo] Classificação - Avaliação de Classificadores
Semana 7 16 a 19/03 [Slides][Vídeo] Regressão Logística

[Slides][Vídeo] Máquinas de Vetores de Suporte

[Slides][Vídeo] k-vizinhos mais próximos

[Slides][Vídeo] Árvores de Decisão

Semana 8 23 a 26/03 [Slides][Vídeo] Regressão

[Colab Notebook][Vídeo] Regressão e Seleção de Parâmetros com Python/sklearn

Semana 9 30/03 a 01/04 Não teremos vídeos
Semana 10 06/04 [Slides][Vídeo] Introdução ao Agrupamento de Dados

[Slides][Vídeo] K-means

Semana 10 09/04 [Slides][Vídeo] Expectation Maximization e DBSCAN

[Slides][Vídeo] Agrupamento hierárquico

Semana 10 13/04 [Slides][Vídeo] Regras de Associação
Semana 11 20 a 23/04 Finalização de Projetos (Não teremos vídeo)
Semana 12 27 a 30/04 [Colab Notebook][Vídeo] Agrupamento (com Python)

[Colab Notebook][Vídeo] Regras de Associação (com Python)


Atividades práticas


Avaliação


Seminário

Grupo Artigo Apresentação
Henrique Ferreira dos Santos Unsupervised word embeddings capture latent knowledge from materials science literature, Nature volume 571, pages 95–98 (2019). vídeo
Andreza Silva, José Anilto dos Anjos Van Der Aalst, Wil. "Process mining: Overview and opportunities." ACM Transactions on Management Information Systems (TMIS) 3.2 (2012): 1-17. vídeo
Guilherme Brejero Washio, Takashi, and Hiroshi Motoda. "State of the art of graph-based data mining." Acm Sigkdd Explorations Newsletter 5.1 (2003): 59-68. vídeo
Bruno João da Silva, Francis Borges de Oliveira Shu, Kai, et al. "Fake news detection on social media: A data mining perspective." ACM SIGKDD explorations newsletter 19.1 (2017): 22-36. vídeo
Rodrigo Modesto, Gabriel Navarro BIRNBAUM, EDITED BY DAVID. "Application of data mining techniques to healthcare data." Infection control and hospital epidemiology (2004). vídeo
Kleber Pires Dhanachandra, Nameirakpam, Khumanthem Manglem, and Yambem Jina Chanu. "Image segmentation using K-means clustering algorithm and subtractive clustering algorithm." Procedia Computer Science 54 (2015): 764-771. vídeo
Carlos Jair Coletto e Marcos Farineli Romero, Cristobal, and Sebastian Ventura. "Data mining in education." Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 3.1 (2013): 12-27. vídeo
Beatriz Mayumi Andrade Matsui Agrawal, Shikha, and Jitendra Agrawal. "Survey on anomaly detection using data mining techniques." Procedia Computer Science 60 (2015): 708-713. vídeo
Italo Giullian Carvalho de Albuquerque, Francisco Felix da Silva Junior Nemati, Shamim, et al. "An interpretable machine learning model for accurate prediction of sepsis in the ICU." Critical care medicine 46.4 (2018): 547. vídeo
Carlos Reynaldo Portocarrero Tovar e Thayron Crystian Hortences de Moraes R Asif, A Merceron, SA Ali, NG Haider Analyzing undergraduate students' performance using educational data mining Computers & Education 113, 2017 177-194 vídeo
André Ramalho Segal Mark R. Machine learning benchmarks and random forest regression] (2004). vídeo
Jarriv Alcantara de Oliveira Reginaldo e Kanan Castro Silva Aplicações em Healthcare paper1, paper2 e paper3 vídeo
Rodrigo Dobbin Fellows Rajman, Martin, and Romaric Besançon. "Text mining: natural language techniques and text mining applications." Data mining and reverse engineering. Springer, Boston, MA, 1998. 50-64. vídeo
André Macedo Datta, S., Bhaduri, K., Giannella, C., Wolff, R., & Kargupta, H. (2006). Distributed data mining in peer-to-peer networks. IEEE internet computing, 10(4), 18-26. vídeo
Davidson de Faria, Gabriel Martins Trettel Algorithm Fairness paper1, paper2, e paper3 vídeo

Projeto