Saltar al contingut Menu
Mapa
  • Inici
  • Informació
  • Contacte
  • Mapa

Projecte d'Explotació de la Informació (PEI)

Crèdits Dept. Tipus Requisits
7.5 (6.0 ECTS) EIO-CS
  • Optativa per a l'EI
ES2 - Pre-requisit per la EI
MD - O-requisit per la EI
SIM - O-requisit per la EI

Professors

Responsable:  (-)
Altres:(-)

Objectius Generals

Definim l'explotació de la informació com a procés d'extracció, síntesi i/o presentació de la informació rellevant, extracció de coneixement a partir de grans repositoris de dades massives i estructurades. Proveeix el nucli de funcionalitats per accedir a la informació i al coneixement necessaris en els processos de presa de decisions, tant quantitatius, com qualitatius. Entre d'altres comprèn transformació, recuperació, exploració, inducció, interpretació, avaluació, síntesi, fusió, presentació i visualització així com elements de comunicació de la informació i del coneixement.

En l'actualitat, les organitzacions han de gestionar i explotar grans quantitats de dades en múltiples formats, provinents de diferents fonts i medis i n'han d'obtenir informació qualificada i coneixement rellevant sobre la pròpia organització, que han de ser convenientment disseminats en múltiples formats. Cal localitzar la informació desitjada, explorar les relacions existents, induir i obtenir el coneixement, i integrar dades i presentar els resultats de forma visual de manera que sigui el més significativa per a l'usuari.

Es tracta de realitzar el procés d'explotació de la informació dins el context empresarial, com un procés cabdal de valorització dels sistemes de informació empresarials. L'alumne ha de saber integrar els coneixements adquirits en assignatures prèvies sobre organitzacions, gestió de bases de dades, tecnologies XML, tècniques d'intel'ligència artificial i mineria de dades, tècniques d'aprenentatge inductiu, tècniques estadístiques i de investigació operativa i simulació per a la presa de decisions, etc. per desenvolupar un projecte global d'explotació i anàlisi de la informació i extracció del coneixement implícit en un repositori massiu de dades. L'objectiu final és el disseny i implementació d'un sistema complet d'explotació de la informació i d'extracció del coneixement, que inclogui des de la recollida de les dades fins la presentació dels resultats per a la resolució d'un problema empresarial.

Els objectius docents d'aquesta assignatura s'estructuren en tres nivells:

1. Posar en pràctica i facilitar la integració dels coneixements de l'estudiant pel que fa a estructures de dades i programació de tècniques quantitatives i qualitatives, i tècniques de mineria de dades, fent ús de les llibreries i programes preexistents.

2. Experimentar el procés de desenvolupament d'un projecte d'explotació de la informació, segons una llista de projectes predefinits, en totes les seves fases com, per exemple, disseny de l'estructura de dades, disseny de la interfície, selecció dels components, presentació gràfica dels resultats i estudi pilot.

3. Facilitar el treball en equip al distribuir les parts del projecte entre les diferents persones integrants d'un grup.

Objectius Específics

Coneixements

  1. Proporcionar un coneixement general del paper de les dades, la informació i el coneixement en els processos empresarials.
  2. Planificació i disseny d'un procés d'explotació de la informació.
  3. Integració de tècniques de gestió de la informació, tècniques quantitatives i tècniques qualitatives de tractament de la informació i del coneixement.
  4. Introduir a l'estudiant en la utilització tant de funcions matemàtiques com de models de coneixement per a la modelització de relacions de variables de negoci en l'àmbit empresarial.
  5. Concepció de sistemes de presentació de resultats.
  6. Conèixer projectes empresarials i eines d'explotació de la informació i extracció del coneixement.
  7. Coneixement i utilització d'eines específiques de programació.

Habilitats

  1. Identificar situacions empresarials d'explotació de la informació i extracció del coneixement.
  2. Identificar les tècniques quantitatives (estadístiques, d'investigació operativa i/o informàtiques) i les qualitatives (d'intel·ligència artificial, d'aprenentatge inductiu i de mineria de dades) més apropiades al problema a resoldre.
  3. Desenvolupar mecanismes de confiança i de competència en termes de mètodes analítics quantitatius i/o mètodes inductius qualitatius de suport a la presa de decisions.
  4. Implementar sistemes informàtics de recollida de dades.
  5. Implementació i/o integració de components de software de tractament de la informació.
  6. Saber determinar la millor forma d'interacció amb l'usuari.
  7. Documentació de totes les fases del projecte.
  8. Presentació gràfica de resultats.
  9. Planificació i temporalització del projecte i fites a assolir.

Competències

  1. Treball en equip
  2. Capacitat de resolució de problemes quantitatius i/o qualitatius en un context empresarial, per al suport a la presa de decisions.
  3. Redacció d'informes i defensa oral dels mateixos.
  4. Capacitat integradora de les eines i resultats d'un sistema d'explotació de la informació i d'extracció del coneixement.

Continguts

Hores estimades de:

T P L Alt L Ext. Est A Ext.
Teoria Problemes Laboratori Altres activitats Laboratori extern Estudi Altres hores fora d'horari fixat

1. SISTEMES D'EXPLOTACIÓ DE LA INFORMACIÓ
T      P      L      Alt    L Ext. Est    A Ext. Total 
5,0 0 0 0 0 2,0 0 7,0
1. Introducció.
2. Importància dels models quantitatius i qualitatius a l'empresa.
3. Exemples de problemes i sistemes d'explotació de la informació i d'extracció del coneixement.
4. Les diferents parts d'un projecte d'explotació de la informació.
5. Explicació de l'enunciat dels projectes i discussió d'alternatives.
6. Explicació del pla de desenvolupament, dels objectius de cada etapa i de la metodologia a seguir.
7. Explicació del contingut de cada lliurament de material i dels criteris de valoració.

2. SELECCIÓ DELS SISTEMES D'EXPLOTACIÓ DE LA INFORMACIÓ I D'EXTRACCIÓ DEL CONEIXEMENT
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 3,0 0 0 2,0 0 7,0
A partir dels coneixements adquirits al llarg dels estudis, determinar les alternatives d'explotació de la informació i d'extracció del coneixement més adequats, en funció d'objectius, limitacions i recursos.

3. LA RECOLLIDA DE DADES
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 3,0 0 0 2,0 0 7,0
1. Anàlisi de les dades, integració, fusió, tractament de dades mancants.
2. Tipus de recollida de dades. Sistemes automàtics per a la recollida de dades.
3. Filtratges. Qualitat. Seguretat i confidencialitat.

4. ESTRUCTURA DE LES DADES PER AL PROJECTE
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 3,0 0 0 2,0 0 7,0
1. Sistemes informàtics de gestió de dades. Metadades.
2. Model conceptual de les metadades.
3. Enfoc específic per a projectes d'explotació de la informació i d'extracció de coneixement.

5. ESPECIFICACIÓ I DISSENY D'UN SISTEMA D'EXPLOTACIÓ DE LA INFORMACIÓ QUANTITATIVA I/O QUALITATIVA
T      P      L      Alt    L Ext. Est    A Ext. Total 
4,0 0 6,0 0 6,0 8,0 0 24,0
1. Programari especialitzat existent, tant per a l'ús de tècniques numèriques estadístiques, de simulació, o de investigació operativa, com de mètodes d'intel·ligència artificial, mineria de dades o d'aprenentatge automàtic.
2. Demostracions i proves.
3. Selecció de components i integració.

6. INTERACCIÓ AMB L'USUARI
T      P      L      Alt    L Ext. Est    A Ext. Total 
1,0 0 3,0 0 0 1,0 0 5,0
Determinació de les formes de comunicació amb l'usuari més adequades segons aplicacions i sectors empresarials i tipus d'organització.

7. PRESENTACIÓ DE RESULTATS
T      P      L      Alt    L Ext. Est    A Ext. Total 
1,0 0 3,0 0 3,0 1,0 0 8,0
1. Disseny de l'estructura de dades pels resultats.
2. Optimització de la visualització i representació gràfica dels mateixos.
3. Ergonomia visual.

8. VALIDACIÓ, CONTROL DE QUALITAT I DOCUMENTACIÓ
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 3,0 0 3,0 2,0 0 10,0
1. Validació de models, dades, fluxes, informació. Proves. Criteris de qualitat.
2. Documentació tècnica i d'usuari. Estàndards de documentació. Eines d'ajut a la documentació.

9. PRESENTACIÓ DE CASOS PROFESSIONALS
T      P      L      Alt    L Ext. Est    A Ext. Total 
7,0 0 0 0 0 3,0 0 10,0
Presentació de projectes actuals d'explotació de la informació i/o d'obtenció de coneixement en diferents sectors empresarials.

10. DESENVOLUPAMENT DEL PROJECTE
T      P      L      Alt    L Ext. Est    A Ext. Total 
0 0 18,0 0 36,0 0 0 54,0
Els estudiants desenvolupen el projecte en grup, amb la supervisió del/s tutor/s
  • Laboratori:
    Seguiment de l'evolució del projecte. Recollida dels informes parcials. Entrevistes amb el professor tutor del projecte per discutir alternatives, solucionar dubtes, rebre comentaris sobre el material ja lliurat i, en general, fer un seguiment de l'estat del projecte.
  • Activitats de laboratori addicionals:
    Treball fora d'hores reglades destinat al desenvolupament del projecte. S'inclou el temps passat en trobades presencials amb els altres membres del grup i amb interacció off-line (per exemple, via correu electrònic) amb ells i amb el tutor.

11. PRESENTACIÓ DELS INFORMES
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 0 0 8,0 0 0 10,0
Presentació oral del projecte desenvolupat. Defensa de les opcions proposades i dels resultats aconseguits.


Total per tipus T      P      L      Alt    L Ext. Est    A Ext. Total 
28,0 0 42,0 0 56,0 23,0 0 149,0
Hores addicionals dedicades a l'avaluació 3,0
Total hores de treball per l'estudiant 152,0

Projecte

Descripció

Els projectes proposats als estudiants tenen les següents característiques:

- Es proposen diferents projectes empresarials d'explotació de la informació i del coneixement. Tots ells permeten una solució mínima, però de complexitat creixent segons la motivació dels estudiants.
- El projecte comporta la integració de diferents components.
- El projecte té un fort component d'estructures de dades, algorísmic i de tractament estadístic i/o d'investigació operativa, així com de tècniques de mineria de dades i/o d'intel·ligència artificial.
- L'objectiu de l'estudiant és realitzar un sistema complet d'explotació de la informació i d'extracció de coneixement, comprenent totes les seves fases.
- Per a la seva implementació, es fomentarà el treball en equip de diverses persones i l'aportació de components a altres projectes.

El sistema de treball serà el següent:

- Els estudiants s'organitzen en grups de fins un màxim de 4 persones.
- Cada grup tindrà un professor tutor assignat.
- Hi haurà un mínim de 4 enunciats diferents cada quadrimestre. Cada grup haurà d'escollir un problema per a la seva resolució o negociar amb el/s professor/s la seva pròpia proposta.
- Dins de cada grup, un estudiant i tan sols un serà el responsable de cada part integrant del projecte.

Pla de desenvolupament

La primera setmana del curs serà destinada a la presentació dels projectes i a la constitució dels grups de treball.
Cada grup haurà de formalitzar la temporalització del seu projecte. El moment de les entregues ve definida en aquesta temporalització.
Les entregues previstes són les següents:

- Primer lliurament: Informe de definició del projecte: projecte escollit, components del projecte, responsable de cada component i temporalització. Explicació del problema a resoldre i dels requeriments d'usuari i tècnics del programa. Es lliurarà un enunciat ampliat en llenguatge natural, una descripció detallada de les funcionalitats a desenvolupar, un model del domini del problema i la llista de requeriments no funcionals del programa.

- Segon lliurament: Especificació, disseny i anàlisi del projecte global i de cada una de les seves components. A fi de evitar la reiteració de treball, creiem interessant fer primer l'anàlisi de la adequació de l'especificació als objectius proposats prèvia al lliurament del disseny definitiu. Això implicarà, en conseqüència, un desdoblament del lliurament en dues parts:
a) Especificació del projecte global i de cadascuna de les seves components. Hi haurà una sessió específica d'avaluació preliminar.
b) Disseny i anàlisi del projecte global i de cada una de les seves components.

- Tercer lliurament: Informe de meitat d'execució del projecte.

- Quart lliurament: Informe final del projecte. La presentació consisteix en una presentació pública de cada grup d'aproximadament una hora de durada, en la qual els estudiants fan una "demo" del seu sistema i responen a les possibles preguntes del tutor.

Metodologia docent

L'aprenentatge es farà per grups, seguint la metodologia dels casos, a partir d'una llista de projectes proposats. Per altra banda l'assignatura fomentarà el contacte amb les empreses punteres amb projectes importants d'explotació de la informació: TSS, AIS, LCFIB, TNS, Aleasoft, ...

Les classes de teoria serveixen per presentar els continguts generals de l'assignatura, les explicacions sobre els enunciats del projecte, la metodologia general a seguir en cada etapa, les diferents opcions de resolució i el material que cal incloure en cada lliurament.

Pel que fa a les classes de laboratori serveixen perquè el professor presenti breument les notacions, llenguatges, llibreries i eines a utilitzar. En la majoria de classes de laboratori, però, no és el professor qui porta la iniciativa. Són unes hores que cada grup de projecte pot fer servir per treballar en comú, o bé per consultar dubtes amb el professor i rebre comentaris sobre els lliuraments anteriors.
Atès que es tracta d'una assignatura de projectes, una part important de la feina correspon a la pròpia autogestió dels estudiants en cada grup, fora d'hores de classe reglades.

Mètode d'avaluació

L'avaluació es farà a partir dels quatre lliuraments segons les següents ponderacions:

Lliurament 1 (Definició i disseny global del sistema): 10%
Lliurament 2 (Especificacions i anàlisi de cada component): 15%
Lliurament 3 (Mid-term report): 15%
Lliurament 4 (Final): 60%

Aquests lliuraments es distribuiran de forma equilibrada en el temps, al llarg del quadrimestre, de forma que garanteixin un desenvolupament adequat del projecte.

L'avaluació del projecte tindrà en compte tant l'aportació individual de l'estudiant com els resultats del seu grup, la qual cosa es reflectirà en la nota de cada estudiant. La nota final del grup (NG) es calcularà aplicant els percentatges esmentats per a cada lliurament. La nota de participació de l'estudiant (NE) tindrà en compte les diferents fases del projecte, pel què fa a les tasques assignades a l'estudiant. La nota final de l'assignatura per a cada estudiant serà N = 0.5*NG + 0.5*NE.

En l'informe final s'avalua per una banda l'assoliment dels objectius previstos, fins a quin punt el sistema és complet i funciona correctament i també la qualitat de la feina realitzada, de cada una de les seves components, del disseny efectuat, de la codificació, de la interficie, la presentació dels resultats i l'existència de documentació d'usuari i tècnica suficient del projecte.

Bibliografía bàsica

  • Dewhurst, F. Quantitative Methods for Business and Management, McGraw-Hill, 2002.
  • Vasant Dhar, Roger Stein Intelligent decision support methods : the science of knowledge work, Prentice Hall, 1997.
  • George M. Marakas Decision support systems in the 21st century, Pearson Education, 2003.
  • Clare Morris Quantitative approaches in business studies, Prentice Hall-Financial Times, 2003.
  • James A. Senn Information technology : principles, practices, and opportunities, Pearson Prentice Hall, 2004.

Bibliografía complementària

  • Jon Curwin and Roger Slater Quantitative methods for business decisions, Thomson, 2002.
  • Vasant Dhar, Roger Stein Seven methods for transforming corporate data into business intelligence, Prentice-Hall,, 1997.
  • Usama M. Fayyad ... [et al.], [editors] Advances in knowledge discovery & data mining, AAA/MIT Press, 1996.
  • Michel R. Klein, Leif B. Methlie Knowledge-based decision support systems with applications in business, John Wiley & Sons, 1995.
  • Tom M. Mitchell Machine learning, The McGraw-Hill Companies, 1997.
  • Ian H. Witten, Eibe Frank Data mining : practical machine learning tools and techniques with java implementations, Morgan Kaufmann Publishers, 1999.

Enllaços web

  1. http://stats.gla.ac.uk
    és la pàgina del Statistics Dept. de la University of Glasgow


  2. http://www.idescat.es
    és la pàgina del Institut d'Estadística de Catalunya


  3. http://www.europa.eu.int/comm/eurostat
    és la pàgina de la Oficina d'Estadística de la Unió Europea


  4. http://www.ics.uci.edu/~mlearn/MLRepository.html
    és un repositori de bases de dades


  5. http://www.scd.ucar.edu/hps/GROUPS/dm/dm.html
    és una pàgina de recursos de mineria de dades


  6. http://www.cacs.louisiana.edu/~arlab/repos/sortedSites.html
    és una pàgina de recursos diversos per a mineria de dades


  7. http://www.cs.waikato.ac.nz/~ml/
    és la pàgina del sistema de mineria de dades WEKA


  8. http://www.r-project.org/
    és la pàgina del sistema R per a modelització estadística i visualització


Capacitats prèvies

Per seguir l'assignatura es convenient que l'estudiant hagi adquirit una sèrie de conceptes, en particular:

- Coneixement dels mecanismes d'estructuració de la informació. Capacitat d'usar i programar estructures de dades (taules, estructures lineals, diccionaris, etc.).
- Disseny de sistemes informàtics.
- Mètodes de tractament de la Informació i d'extracció del Coneixement (Mineria de Dades, Aprenentatge automàtic, Previsions, Models de la Investigació Operativa, Simulació, ...).


Compartir

 
logo FIB © Facultat d'Informàtica de Barcelona - Contacte - RSS
Aquest web utilitza cookies pròpies per oferir una millor experiència i servei. En continuar amb la navegació entenem que acceptes la nostra política de cookies.
Versió clàssica Versió mòbil