Responsable: | (-) |
Altres: | (-) |
Crèdits | Dept. | Tipus | Requisits |
---|---|---|---|
7.5 (6.0 ECTS) | CS |
|
IA
- Pre-requisit per la EI |
Responsable: | (-) |
Altres: | (-) |
Presentar un panorama dels problemes que presenta el processament de la llengua (llenguatge natural o llenguatge humà), les tècniques que es fan servir per abordar-los i els fonaments teòrics en que es basen aquestes tècniques.
La base de l'assignatura es l'estudi de l'Enginyeria Lingüística en les seves tres vessants:
1. mètodes i eines
2. recursos i formes d'adquirir-los
3. aplicacions.
L'enfocament de l'assignatura serà bàsicament pràctic. Es tractaran les dues grans àrees d'aplicació: els sistemes basats en diàlegs persona/màquina i els sistemes de processament de grans volums d'informació textual.
El temari de l'assignatura pretén cobrir les dues aproximacions que normalment es fan servir en les tasques de processament del llenguatge natural: l'aproximació basada en el coneixement (bàsicament lingüístic) i l'aproximació basada en mètodes empírics (bàsicament de tipus estadístic o d'Aprenentatge Automàtic).
Hores estimades de:
T | P | L | Alt | L Ext. | Est | A Ext. |
Teoria | Problemes | Laboratori | Altres activitats | Laboratori extern | Estudi | Altres hores fora d'horari fixat |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
5,0 | 5,0 | 8,0 | 0 | 10,0 | 10,0 | 0 | 38,0 | |||
Tractaments textual, lèxic i morfològic.
Tasques de processament textual. Segmentació del text. Identificació de la llengua. Tasques de processament lèxic. Identificació d'unitats lèxiques. El concepte de paraula. Lexicons, diccionaris. Ontologies lèxiques i semàntiques. Corpus. Formes d'adquisició de l'informació lèxica. Tasques de processament morfològic. Analitzadors morfològics. Eines basades en tècniques d'estats finits (autòmats i transductors d'estats finits). Tècniques d' Aprenentatge Automàtic aplicades a la morfologia. Inducció de la morfologia. Desambiguació morfo-sintàctica (POS tagging) i semàntica (WSD). |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
12,0 | 7,0 | 8,0 | 0 | 15,0 | 15,0 | 0 | 57,0 | |||
Formalismes sintàctics.
Conceptes bàsics de llenguatges formals. Gramàtiques. Tipus de gramàtiques. Gramàtiques sintagmàtiques. Gramàtiques incontextuals ampliades. Gramàtiques lògiques. Formalismes sintàctics recents: GPSG, HPSG.Gramàtiques de trets amb i sense tipus (PATR II, ALE, CUF, etc.). Tècniques bàsiques d' Anàlisi Sintàctica. Analitzadors guiats per Gramàtiques incontextuals. Gramàtiques incontextuals esteses: ATN, CHART, CKY, Earley, LR, Tomita. Analitzadors guiats per gramàtiques lògiques. Problemes que planteja la gestió de l' unificació. Analitzadors estadístics, superficials i fragmentals. Chunkers. Comparació entre les aproximacions simbòlica i empírica. Formes d'adquisició de l'informació sintàctica. Inducció gramatical. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
4,0 | 2,0 | 4,0 | 0 | 5,0 | 5,0 | 0 | 20,0 | |||
Formes de representació semàntica. Diccionaris semàntics. Ontologies semàntiques.
Semàntica lèxica. Desambiguació semàntica (WSD). Interpretació semàntica. Col·laboració entre sintaxi i semàntica. Semàntica discursiva. Diàlegs. Gramàtiques del diàleg. Pragmàtica. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 0 | 0 | 0 | 2,0 | 0 | 4,0 | |||
Generació del Llenguatge Natural.
Generació tàctica i estratègica. Mètodes simbòlics i estadístics. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 8,0 | 0 | 9,0 | 4,0 | 0 | 23,0 | |||
Aplicacions basades en diàlegs.
Interfícies en LN. Interfícies multimodals. Traducció automàtica. Recuperació de l' informació. Extracció de l' informació. Resum automàtic. Cerca de la resposta. Sistemes multilingües. |
Total per tipus | T | P | L | Alt | L Ext. | Est | A Ext. | Total |
28,0 | 14,0 | 28,0 | 0 | 39,0 | 38,0 | 0 | 147,0 | |
Hores addicionals dedicades a l'avaluació | 3,0 | |||||||
Total hores de treball per l'estudiant | 150,0 |
Les classes estan dividides en sessions de teoria, problemes i laboratori. A les sessions de teoria es desenvoluparan els coneixements de l'assignatura. Les classes de problemes permetran aprofundir en les tècniques i algorismes explicats a les sessions de teoría.
A les classes de laboratori es desenvoluparan petites pràctiques utilitzant eines i llenguatges adequats al PLN (bàsicament fent servir Python, Prolog, FreeLing i NLTK) que permetran practicar i reforçar els coneixements de les classes de teoria.
L'avaluació es basarà en un examen parcial, un examen final i una nota de laboratori.
L'examen parcial no serà alliberatori i es farà a hores de classe. Les persones que no aprovin o no facin l'examen parcial seran avaluades només amb la nota de l'examen final.
La nota de laboratori provindrà dels informes que es faran de les practiques realitzades a les classes de laboratori.
El càlcul de la nota final es farà de la següent manera:
Nota Final = max (Nota examen parcial * 0.15 + Nota examen final * 0.45, Nota examen final * 0.6) + Nota laboratori * 0.4
Els estudiants haurien de tenir coneixements de:
Representació del coneixement
Tècniques de resolució de problemes
Conceptes bàsics de Processament del Llenguatge Natural
Conceptes de llenguatges formals (concretament autòmats finits,
llenguatges regulars i incontextuals)
Per això, les assignatures Intel·ligència Artificial i Teoria de la Computació
haurien de ser prerequisits d'aquesta.
Com a suggeriment addicional es recomana haver cursat l'assignatura de Compiladors.