MCZA017-13 - Processamento de Linguagem Natural

Professor: Jesús P. Mena-Chalco


Quadrimestre 2 - 2019 - Turma A - Noturno
Segunda-feira das 19h às 21h - Sala S-214-0 (segundo andar, bloco A).
Quinta-feira das 21h às 23h - Sala A-114-0 (primeiro andar, bloco A).

Calendário:

Lista de presença: Planilha

Agenda
 Aula  Data              Conteúdo  Arquivos adicionais 
01 03/06 Apresentação
Introdução a processamento de linguagem natural
[ Teste | Resumos ]
02 06/06 Expressões regulares [ Teste | Mini-Eliza | Resumos ]
03 10/06 Normalização de texto: Palavras e stopwords [ Teste | Scripts | Resumos ]
04 12/06 Normalização de texto: Stemming e grafos de palavras [ Teste | Scripts | Resumos ]
05 17/06 Modelando a linguagem com N-gramas [ Teste | Resumos ]
06 24/06 Modelando a linguagem com N-gramas:
Geração de frases e Correção ortográfica
[ Teste | Scripts | Resumos ]
07 27/06 Classificação de textos [ Teste | Scripts | Resumos ]
08 01/07 Semântica e similaridade de palavras: Parte I
Definições e similaridade usando tesauro
[ Teste | Resumos ]
09 04/07 Semântica e similaridade de palavras: Parte II
Matriz termo-documento e termo-termo
[ Scripts | Resumos ]
10 11/07 Semântica e similaridade de palavras: Parte III
Matriz termo-contexto e Pointwise Mutual Information
[ Teste | Scripts | Resumos ]
11 15/07 Semântica e similaridade de palavras: Parte IV
Semântica e vetores densos (via SVD)
[ Scripts | Resumos ]
12 18/07 Feature Hashing (Hashing trick) [ Scripts | Resumos ]
13 22/07 Reconhecimento de entidades nomeadas [ Scripts | Resumos ]
14 29/07 NLTK através de exemplos: Sumarização [ Scripts | Resumos ]
15 01/08 NLTK através de exemplos: Modelagem de tópicos
Redes de co-ocorrência
[ Scripts | Resumos ]
16 05/08 NLTK através de exemplos: Análise de sentimentos
Similaridade entre ementas UFABC
[ Scripts | Resumos ]
17 08/08 Sobre as avaliações: Prova e projetos [ Resumos ]
18 12/08 Plantão de dúvidas: Prova e projetos
19 15/08 Prova de teoria (única)
20 22/08 (21h) Apresentações de projetos - Parte 1
21 26/08 (19h) Apresentações de projetos - Parte 2
22 27/08 (21h) Apresentações de projetos - Parte 3
23 29/08 (19h) Apresentações de projetos - Parte 4
24 02/09 (19h) Prova substitutiva
(enviar email para confirmar presença)
25 30/setembro Prova de recuperação no Q3/2019.
Dois horários disponíveis: 17h-19h ou 19h-21h)
(enviar um email para reservar sala)

Ementa:
Introdução ao processamento de linguagem natural. Processamento sintático. Técnicas de análise (parsing). Gramáticas. Interpretação semântica. Processamento de discurso. Aplicações. Nas aulas teremos uma introdução sobre os conceitos básicos necessários para a compreensão dos tópicos mais avançados.

Requisitos:
É recomendável ter conhecimentos básicos sobre: Algegra linear, probabilidade e lógica de programação (PI, PE). Vontade de aprender conceitos novos de linguistica computacional. Conhecimentos sobre Inteligência Artificial e Algoritmos e Estruturas de Dados são desejáveis.

Área no Tidia/UFABC: PLN-Q2-2019

TPI: 4-0-4

Bibliografia