You are on page 1of 6

Declaració de treball original (no plagi) de l'estudiant

Jo Teresa Trullén , declaro que per realitzar aquest lliurament ho he fet jo sola i sense plagiar cap altre
document

Pregunta 1 (20% puntuació)


Respostes

Apartat 1

S’ha utilitzat el registre de dades de l’Agència Estatal de Meteorologia (AEMET), en concret


les temperatures màximes enregistrades en les capitals de província, que es comparen
amb la mitjana històrica de las màximes enregistrades entre 1981 y 2010, que s’agafa com
a període de referència.
Es fa la aproximació de la temperatura de “la provincia” a la temperatura enregistrada en la
seva capital cosa que podria introduir algun petit factor de distorsió, però llevat d’això crec
que es tracta de dades verificades i fiables.

Apartat 2

Cada temperatura enregistrada és una dada simple, però la seqüència de temperatures


enregistrades en una determinada capital és una dada estructurada en forma d’una array
1D on els camps corresponen a les temperatures màximes diàries..
El conjunt de l’històric de temperatures màximes per província és una dada estructurada en
un array 2D on cada registre correspon a una província i cada camp a la temperatura
màxima enregistrada un dia en concret en la capital d’aquesta provincia .

Apartat 3

No hi ha comentaris però en qualsevol cas crec que es tractaria de dades


semiestructurades ja que es tractar de text estructurat en paraules i a la vegada en linies
que conformaran paràgrafs

Apartat 4

L’article pretén donar resposta a la pregunta de si aquest estiu ha estat més calorós o no
de lo normal, i també a corroborar amb dades l’escalfament global i el canvi climàtic.
Pel que fa al tractament de visualització de les dades fa us de diferents sistemes de
representació, utilitza taules, gràfics com el mapa o complexes com el de les temperatures
màximes diàries comparat amb la mitjana de les màximes diàries en el període de
referència (1980-2010) i gràfic del tipus climate stripes.

Introducció a la Ciència de Dades ꞏ PAC 1 Tardor 2021 Pàg 1


Estudis de Informàtica, Multimèdia i Telecomunicació
Sí, trobo que s’aprofiten be les eines de visualització de dades

Pregunta 2 (30% puntuació)


Respostes

Apartat 1
En els mesos de setembre i octubre s’han produït tot un seguit de moviments sísmics molt
seguits a la illa de la palma i a continuació s’han produït diverses erupcions volcàniques
que han obligat a evacuar a les persones residents en llocs propers als cràters apareguts
del volcà. Disposem de les dades sísmiques registrades des del setembre i fins a dia
d’avui, facilitades pel consell insular de la illa de la palma.
La pregunta que ens formulem és com ha afectat a les vivendes de les zones properes i
també ens agradaria preveure quines zones més es poden veure afectades

Apartat 2

Com a fonts de dades podem utilitzar les de moviments sísmics que ens proporciona la
mateixa web opendatapalma.es i per les de edificis afectats he trobat les dades en aquesta
web
https://www.opendatalapalma.es/datasets/edificaciones/explore?location=28.681009%2C-
17.805989%2C11.73&showTable=true
I també ja tractades en aquest altra https://riesgovolcanico-lapalma.hub.arcgis.com/ tot i
que no descarregables directament, per tal caldrà extreure-les mitjançant data scrapping i
passar-les a un fitxer.
Per garantir la validesa de les dades cal assegurar-se que les dona una font oficial com en
aquest cas el propi Cabildo de la Palma

Apartat 3

Les dades estaran desades en una colꞏlecció de fitxers en forma de taules i amb format
obert csv.
Pel que fa a la validació podem comprovar que tots els punts tant de la taula d’edificacions
com de la de moviments sísmics són representables sobre el mapa de la illa de La Palma,
que no hi ha punts repetits i que cap registre és erroni. En cas de detectar algun registre
erroni per algun d’aquests motius el suprimirem

Apartat 4

Per fer l’anàlisi de dades en el mateix portal es poden utilitzar els mapes superposant les
capes per veure les zones dels edificis afectats que es correspondria amb la tècnica de

Introducció a la Ciència de Dades ꞏ PAC 1 Tardor 2021 Pàg 2


Estudis de Informàtica, Multimèdia i Telecomunicació
visualització. També tècniques de Anàlisi estadística inferencial per mirar de modelar la
distribució de moviments sísmics.
La millor manera de presentar les dades d’edificis afectats és mitjançant diferents
diagrames, afectacions diàries a edificis, i gràfics de barres per detallar per municipis i tipus
d’ús, similars a aquests:

Apartat 5

La publicació de les dades es pot fer en format web de manera que es puguin filtrar per poblacions
afectades o per tipus d’usos i per dies

Els destinataris principals són les veins de La Palma però també altre públic general i també altres
persones de la comunitat científica

Pregunta 3 (30% puntuació)


Respostes

Apartat 1
El cas escollit és el que es relata en aquest article:
https://www.clinicbarcelona.org/ca/noticies/el-clinic-i-el-bsc-utilitzaran-la-intel-ligencia-

Introducció a la Ciència de Dades ꞏ PAC 1 Tardor 2021 Pàg 3


Estudis de Informàtica, Multimèdia i Telecomunicació
artificial-per-predir-levolucio-de-pacients-de-covid-19, i que tracta de com l’hospital clínic de
Barcelona està utilitzant les dades extretes dels historials de pacients de CoVid-19 per
predir l’evolució dels pacients i millorar la seva evolució i ajudar a la planificació i
organització interna de l’hospital davant d’una nova onada de casos.
S’utilitza la informació sobre el diagnòstic, el tractament i l'evolució d'aquests casos
(degudament anonimitzada) i s'entrena un model basat en intelꞏligència artificial que busca
patrons comuns i genera prediccions sobre l'evolució de nous pacients.
Per tal d’augmentar el nombre de dades del que disposen s’ha convidat a colꞏlaborar en el
projecte a altres grans hospitals . En el moment en que es va redactar la noticia sembla que
L’Hospital Universitario 12 de Octubre de Madrid i l'Hospital Virgen del Rocío de Sevilla
estaven disposats a sumar-se a l’estudi.
Per poder fer el tractament de les dades es necessita entrenar el model i per això cal gran
capacitat de càlcul fet pel qual es treballa amb el supercomputador Marenostrum (BSC).

Apartat 2

En aquest cas fan servir la ciència de dades amb l’objectiu de millorar la diagnosi i el
tractament de nous pacients CoVid i per extreure i utilitzar les dades de la evolució en
nombre de casos per poder preveure i millorar la organització de llits, espais, medicaments
i personal sanitari necessaris per a atendre una futura nova onada de la malaltia.
És un cas de Machine learning, on s’entrenen models basats en les diferents proves,
tractaments i evolució, provinents dels historials clínics dels pacients per tal que aprenguin
a distingir els trets significatius de la malaltia i poder predir, tractaments i evolució de la
pandèmia.
L'elaboració de models de predicció a partir d'informes clínics tenen la complexitat afegida
d’extreure de forma automàtica tota la informació rellevant que contenen els diversos
documents hospitalaris referents a un cas (informes de laboratori, de radiologia,
diagnòstics, cursos clínics, etc.).
Un objectiu de la colꞏlaboració entre el BSC i l’Hospital, és proveir els sistemes de salut i
els hospitals colꞏlaboradors de sistemes informàtics que puguin contribuir a millorar el
tractament dels pacients tant d'aquesta com de futures epidèmies
Els resultats d’aquest projecte cal esperar que serveixin i es puguin utilitzar en el tractament
d’altres malalties i/o pandèmies. Un camp interessant és el de la interpretació de les
diferents proves basades en imatges com són les radiografies, o els TAC, on actualment el
resultat es basa principalment en la expertesa del metge que les interpreta, podent refinar i
millorar els diagnòstics mitjançant aquest tractament automatitzat.

Apartat 3

L’impacte és múltiple ja que impacta en la millora directa dels tractaments administrats als
nous pacients així com en la reducció de proves a fer, també impacta en la millora de
l’organització interna de l’hospital tant pel que fa a previsió d’espais per a UCI’s, com de
personal necessari per atendre diferents espais i torns, o previsió d’stocks de medicaments
o gestió de cues per diferents proves. També impacta en l'àmbit públic oferint a les

Introducció a la Ciència de Dades ꞏ PAC 1 Tardor 2021 Pàg 4


Estudis de Informàtica, Multimèdia i Telecomunicació
administracions eines per poder preveure i prendre diferents mesures amb temps suficient
davant d’una nova onada CoVid.

Pregunta 4 (20% puntuació)


Respostes

Apartat 1

Les dades obertes són aquelles que són lliures i qualsevol persona les pot extreure
i utilitzar com vulgui, sense drets d’autor, patents o mecanismes de control
Les principals característiques són:
Són Públiques, accessibles, amb format obert i lliures d’ús: qualsevol les pot consultar,
normalment a partir d’un portal i les ha de poder manipular fàcilment i lliurement sense ni
tant sols haver-se de registrar.

Apartat 2

Datos.gob.es és una plataforma que es presenta com a punt de trobada entre les
administracions amb la finalitat de promocionar l'obertura de la informació pública i
desenvolupament de serveis avançats basats en dades.
Disposa d’un ampli catàleg de dades obertes proporcionades per les diferents
administracions.
Les llicències d’us són variades depenent de l’administració, la majoria creative commons,
en general no es requereix cap altre tipus de llicència per utilitzar les dades extretes del
portal tot i que algunes només estan disponibles en format propietari de excel i per tant es
requereix llicència de microsoft

Apartat 3

Les dades estan disponibles per ser descarregades però el portal no facilita la visualització.
Disposa també d’una API basada en URL per filtrar els conjunts de dades que ens
interessen i descarregar-los.

Apartat 4

En general es tracta de dades estructurades en taules i pel que fa a les etapes del cicle de
vida, en aquesta web poden ser trobades només les etapes de captura (podem extreure
les dades utilitzant el cercador i de manera dinàmica utilitzant l’API basada en URL que ens
proporciona el portal) i enmagatzematge Les dades estan guardades en forma de fitxers
simples en diferents formats. La resta d’etapes no hi són presents, ni preprocessament ni
anàlisi ni visualització es poden fer emprant les eines del portal

Introducció a la Ciència de Dades ꞏ PAC 1 Tardor 2021 Pàg 5


Estudis de Informàtica, Multimèdia i Telecomunicació
Introducció a la Ciència de Dades ꞏ PAC 1 Tardor 2021 Pàg 6
Estudis de Informàtica, Multimèdia i Telecomunicació

You might also like