Responsable: | (-) |
Altres: | (-) |
Crèdits | Dept. | Tipus | Requisits |
---|---|---|---|
7.5 (6.0 ECTS) | EIO-CS |
|
ES2
- Pre-requisit per la EI MD - O-requisit per la EI SIM - O-requisit per la EI |
Responsable: | (-) |
Altres: | (-) |
Definim l'explotació de la informació com a procés d'extracció, síntesi i/o presentació de la informació rellevant, extracció de coneixement a partir de grans repositoris de dades massives i estructurades. Proveeix el nucli de funcionalitats per accedir a la informació i al coneixement necessaris en els processos de presa de decisions, tant quantitatius, com qualitatius. Entre d'altres comprèn transformació, recuperació, exploració, inducció, interpretació, avaluació, síntesi, fusió, presentació i visualització així com elements de comunicació de la informació i del coneixement.
En l'actualitat, les organitzacions han de gestionar i explotar grans quantitats de dades en múltiples formats, provinents de diferents fonts i medis i n'han d'obtenir informació qualificada i coneixement rellevant sobre la pròpia organització, que han de ser convenientment disseminats en múltiples formats. Cal localitzar la informació desitjada, explorar les relacions existents, induir i obtenir el coneixement, i integrar dades i presentar els resultats de forma visual de manera que sigui el més significativa per a l'usuari.
Es tracta de realitzar el procés d'explotació de la informació dins el context empresarial, com un procés cabdal de valorització dels sistemes de informació empresarials. L'alumne ha de saber integrar els coneixements adquirits en assignatures prèvies sobre organitzacions, gestió de bases de dades, tecnologies XML, tècniques d'intel'ligència artificial i mineria de dades, tècniques d'aprenentatge inductiu, tècniques estadístiques i de investigació operativa i simulació per a la presa de decisions, etc. per desenvolupar un projecte global d'explotació i anàlisi de la informació i extracció del coneixement implícit en un repositori massiu de dades. L'objectiu final és el disseny i implementació d'un sistema complet d'explotació de la informació i d'extracció del coneixement, que inclogui des de la recollida de les dades fins la presentació dels resultats per a la resolució d'un problema empresarial.
Els objectius docents d'aquesta assignatura s'estructuren en tres nivells:
1. Posar en pràctica i facilitar la integració dels coneixements de l'estudiant pel que fa a estructures de dades i programació de tècniques quantitatives i qualitatives, i tècniques de mineria de dades, fent ús de les llibreries i programes preexistents.
2. Experimentar el procés de desenvolupament d'un projecte d'explotació de la informació, segons una llista de projectes predefinits, en totes les seves fases com, per exemple, disseny de l'estructura de dades, disseny de la interfície, selecció dels components, presentació gràfica dels resultats i estudi pilot.
3. Facilitar el treball en equip al distribuir les parts del projecte entre les diferents persones integrants d'un grup.
Hores estimades de:
T | P | L | Alt | L Ext. | Est | A Ext. |
Teoria | Problemes | Laboratori | Altres activitats | Laboratori extern | Estudi | Altres hores fora d'horari fixat |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 3,0 | 0 | 0 | 2,0 | 0 | 7,0 | |||
A partir dels coneixements adquirits al llarg dels estudis, determinar les alternatives d'explotació de la informació i d'extracció del coneixement més adequats, en funció d'objectius, limitacions i recursos.
|
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 3,0 | 0 | 0 | 2,0 | 0 | 7,0 | |||
1. Anàlisi de les dades, integració, fusió, tractament de dades mancants.
2. Tipus de recollida de dades. Sistemes automàtics per a la recollida de dades. 3. Filtratges. Qualitat. Seguretat i confidencialitat. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 3,0 | 0 | 0 | 2,0 | 0 | 7,0 | |||
1. Sistemes informàtics de gestió de dades. Metadades.
2. Model conceptual de les metadades. 3. Enfoc específic per a projectes d'explotació de la informació i d'extracció de coneixement. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
4,0 | 0 | 6,0 | 0 | 6,0 | 8,0 | 0 | 24,0 | |||
1. Programari especialitzat existent, tant per a l'ús de tècniques numèriques estadístiques, de simulació, o de investigació operativa, com de mètodes d'intel·ligència artificial, mineria de dades o d'aprenentatge automàtic.
2. Demostracions i proves. 3. Selecció de components i integració. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
1,0 | 0 | 3,0 | 0 | 0 | 1,0 | 0 | 5,0 | |||
Determinació de les formes de comunicació amb l'usuari més adequades segons aplicacions i sectors empresarials i tipus d'organització.
|
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
1,0 | 0 | 3,0 | 0 | 3,0 | 1,0 | 0 | 8,0 | |||
1. Disseny de l'estructura de dades pels resultats.
2. Optimització de la visualització i representació gràfica dels mateixos. 3. Ergonomia visual. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 3,0 | 0 | 3,0 | 2,0 | 0 | 10,0 | |||
1. Validació de models, dades, fluxes, informació. Proves. Criteris de qualitat.
2. Documentació tècnica i d'usuari. Estàndards de documentació. Eines d'ajut a la documentació. |
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
7,0 | 0 | 0 | 0 | 0 | 3,0 | 0 | 10,0 | |||
Presentació de projectes actuals d'explotació de la informació i/o d'obtenció de coneixement en diferents sectors empresarials.
|
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
0 | 0 | 18,0 | 0 | 36,0 | 0 | 0 | 54,0 | |||
Els estudiants desenvolupen el projecte en grup, amb la supervisió del/s tutor/s
|
|
T | P | L | Alt | L Ext. | Est | A Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 0 | 0 | 8,0 | 0 | 0 | 10,0 | |||
Presentació oral del projecte desenvolupat. Defensa de les opcions proposades i dels resultats aconseguits.
|
Total per tipus | T | P | L | Alt | L Ext. | Est | A Ext. | Total |
28,0 | 0 | 42,0 | 0 | 56,0 | 23,0 | 0 | 149,0 | |
Hores addicionals dedicades a l'avaluació | 3,0 | |||||||
Total hores de treball per l'estudiant | 152,0 |
Els projectes proposats als estudiants tenen les següents característiques:
- Es proposen diferents projectes empresarials d'explotació de la informació i del coneixement. Tots ells permeten una solució mínima, però de complexitat creixent segons la motivació dels estudiants.
- El projecte comporta la integració de diferents components.
- El projecte té un fort component d'estructures de dades, algorísmic i de tractament estadístic i/o d'investigació operativa, així com de tècniques de mineria de dades i/o d'intel·ligència artificial.
- L'objectiu de l'estudiant és realitzar un sistema complet d'explotació de la informació i d'extracció de coneixement, comprenent totes les seves fases.
- Per a la seva implementació, es fomentarà el treball en equip de diverses persones i l'aportació de components a altres projectes.
El sistema de treball serà el següent:
- Els estudiants s'organitzen en grups de fins un màxim de 4 persones.
- Cada grup tindrà un professor tutor assignat.
- Hi haurà un mínim de 4 enunciats diferents cada quadrimestre. Cada grup haurà d'escollir un problema per a la seva resolució o negociar amb el/s professor/s la seva pròpia proposta.
- Dins de cada grup, un estudiant i tan sols un serà el responsable de cada part integrant del projecte.
La primera setmana del curs serà destinada a la presentació dels projectes i a la constitució dels grups de treball.
Cada grup haurà de formalitzar la temporalització del seu projecte. El moment de les entregues ve definida en aquesta temporalització.
Les entregues previstes són les següents:
- Primer lliurament: Informe de definició del projecte: projecte escollit, components del projecte, responsable de cada component i temporalització. Explicació del problema a resoldre i dels requeriments d'usuari i tècnics del programa. Es lliurarà un enunciat ampliat en llenguatge natural, una descripció detallada de les funcionalitats a desenvolupar, un model del domini del problema i la llista de requeriments no funcionals del programa.
- Segon lliurament: Especificació, disseny i anàlisi del projecte global i de cada una de les seves components. A fi de evitar la reiteració de treball, creiem interessant fer primer l'anàlisi de la adequació de l'especificació als objectius proposats prèvia al lliurament del disseny definitiu. Això implicarà, en conseqüència, un desdoblament del lliurament en dues parts:
a) Especificació del projecte global i de cadascuna de les seves components. Hi haurà una sessió específica d'avaluació preliminar.
b) Disseny i anàlisi del projecte global i de cada una de les seves components.
- Tercer lliurament: Informe de meitat d'execució del projecte.
- Quart lliurament: Informe final del projecte. La presentació consisteix en una presentació pública de cada grup d'aproximadament una hora de durada, en la qual els estudiants fan una "demo" del seu sistema i responen a les possibles preguntes del tutor.
L'aprenentatge es farà per grups, seguint la metodologia dels casos, a partir d'una llista de projectes proposats. Per altra banda l'assignatura fomentarà el contacte amb les empreses punteres amb projectes importants d'explotació de la informació: TSS, AIS, LCFIB, TNS, Aleasoft, ...
Les classes de teoria serveixen per presentar els continguts generals de l'assignatura, les explicacions sobre els enunciats del projecte, la metodologia general a seguir en cada etapa, les diferents opcions de resolució i el material que cal incloure en cada lliurament.
Pel que fa a les classes de laboratori serveixen perquè el professor presenti breument les notacions, llenguatges, llibreries i eines a utilitzar. En la majoria de classes de laboratori, però, no és el professor qui porta la iniciativa. Són unes hores que cada grup de projecte pot fer servir per treballar en comú, o bé per consultar dubtes amb el professor i rebre comentaris sobre els lliuraments anteriors.
Atès que es tracta d'una assignatura de projectes, una part important de la feina correspon a la pròpia autogestió dels estudiants en cada grup, fora d'hores de classe reglades.
L'avaluació es farà a partir dels quatre lliuraments segons les següents ponderacions:
Lliurament 1 (Definició i disseny global del sistema): 10%
Lliurament 2 (Especificacions i anàlisi de cada component): 15%
Lliurament 3 (Mid-term report): 15%
Lliurament 4 (Final): 60%
Aquests lliuraments es distribuiran de forma equilibrada en el temps, al llarg del quadrimestre, de forma que garanteixin un desenvolupament adequat del projecte.
L'avaluació del projecte tindrà en compte tant l'aportació individual de l'estudiant com els resultats del seu grup, la qual cosa es reflectirà en la nota de cada estudiant. La nota final del grup (NG) es calcularà aplicant els percentatges esmentats per a cada lliurament. La nota de participació de l'estudiant (NE) tindrà en compte les diferents fases del projecte, pel què fa a les tasques assignades a l'estudiant. La nota final de l'assignatura per a cada estudiant serà N = 0.5*NG + 0.5*NE.
En l'informe final s'avalua per una banda l'assoliment dels objectius previstos, fins a quin punt el sistema és complet i funciona correctament i també la qualitat de la feina realitzada, de cada una de les seves components, del disseny efectuat, de la codificació, de la interficie, la presentació dels resultats i l'existència de documentació d'usuari i tècnica suficient del projecte.
Per seguir l'assignatura es convenient que l'estudiant hagi adquirit una sèrie de conceptes, en particular:
- Coneixement dels mecanismes d'estructuració de la informació. Capacitat d'usar i programar estructures de dades (taules, estructures lineals, diccionaris, etc.).
- Disseny de sistemes informàtics.
- Mètodes de tractament de la Informació i d'extracció del Coneixement (Mineria de Dades, Aprenentatge automàtic, Previsions, Models de la Investigació Operativa, Simulació, ...).