MCZA017-13 - Processamento de Linguagem Natural

Professor: Jesús P. Mena-Chalco


Quadrimestre 1 - 2018 - Turma A1 - Diurno
Terça-feira das 10:00 às 12:00 - Laboratório 407-2, torre2, bloco A.
Quinta-feira das 08:00 às 10:00 - Sala S-301-1.

TPI: 4-0-4

Atendimento aos alunos: Toda quinta-feira das 16h às 18h no sala 517, torre 2, bloco A.
Ementa:
Introdução ao processamento de linguagem natural. Processamento sintático. Técnicas de análise (parsing). Gramáticas. Interpretação semântica. Processamento de discurso. Aplicações. Nas aulas teremos uma introdução sobre os conceitos básicos necessários para a compreensão dos tópicos mais avançados.

Requisitos:
É recomendável ter conhecimentos básicos sobre: Algegra linear, probabilidade e lógica de programação (PI, PE). Vontade de aprender conceitos novos de linguistica computacional. Conhecimentos sobre Inteligência Artificial e Algoritmos e Estruturas de Dados são desejáveis.

Área no Tidia/UFABC: PLN-Q1-2018

Exemplo de Mini-relatório: [ PDF | ZIP]

Agenda
 Aula  Data              Conteúdo  Arquivos adicionais 
01 20/02 Apresentação
Introdução a processamento de linguagem natural
[ Teste | Resumos ]
02 22/02 Expressões regulares [ Teste | Mini-Eliza | Resumos ]
03 27/02 Normalização de texto: Palavras e stopwords [ Teste | Scripts | Resumos ]
04 01/03 Normalização de texto: Stemming [ Teste | Scripts | Resumos ]
05 06/03 Laboratório
Python, Stemmers, Grafos de palavras e distância de edição
[ Scripts | Resumos ]
06 08/03 Modelando a linguagem com N-gramas [ Teste | Resumos ]
07 13/03 Laboratório
Modelando a linguagem com N-gramas
[ Scripts | Resumos ]
08 15/03 Correção ortográfica [ Teste | Scripts | Resumos ]
09 22/03 Classificação de textos [ Teste | Resumos ]
10 27/03 Laboratório
Classificação de textos
[ Scripts | Resumos ]
11 29/03 Semântica e similaridade de palavras: Parte I
Definições e similaridade usando tesauro
[ Resumos ]
12 03/04 Semântica e similaridade de palavras: Parte II
Matriz termo-documento e termo-termo
[ Scripts | Resumos ]
[Lembrete: Mini-relatório 1]
13 05/04 Semântica e similaridade de palavras: Parte III
Matriz termo-contexto e Pointwise Mutual Information
[ Teste | Resumos ]
14 10/04 Semântica e similaridade de palavras: Parte IV
PPMI e distância cosseno
[ Scripts | Resumos ]
15 12/04 Semântica e similaridade de palavras: Parte V
Semântica e vetores densos (via SVD)
[ Scripts | Resumos ]
16 17/04 Feature Hashing (Hashing trick) [ Scripts | Resumos ]
17 24/04 Reconhecimento de entidades nomeadas [ Scripts | Resumos ]
[Lembrete: Mini-relatório 2]
18 26/04 Plantão de dúvidas - Projetos
-- 01/05 Feriado - Dia do trabalhador
19 03/05 Prova de teoria (única)
20 08/05 Apresentação de projetos - Parte 1 - Sala S-301-1

[Lembrete: Mini-relatório 3]
21 10/05 Apresentação de projetos - Parte 2 - Sala S-301-1
22 15/05 Apresentação de projetos - Parte 3 - Sala S-301-1
23 17/05 Prova substitutiva (aberta) - Sala S-301-1
24 Q2/2018 Prova de recuperação (27/Junho às 17h) - Envie um email para reservar sala

Bibliografia