Llistat d’Exercicis d’Estadística per a ser resolts amb R
Esteve Badia Orive
esteve.badia@upc.edu
Pràctica 1: Primers passos amb R
RStudio projects, scripts, comentaris, vectors i operacions amb vectors.
1. Crea un projecte amb l’RStudio en un directori que es digui practica1
2. Crea un nou script i guarda’l amb nom script1 3. Afegeix un comentari a la part superior del fitxer que digui Primers passos amb R, la data i el teu nom. 4. Crea un vector de nom x amb la funció c que tingui els següents números: 1, 4, 3, 5, 6, 3, 2, 3, 4, 5, 4, 3, 3, 4, 3, 4 5. Calcula la mitjana de x amb la funció mean 6. Crea un vector x1 sumant 1 a cada valor de x. 7. A la consola, utilitza la funció help(seq) per a veure la referència de la funció seq. 8. Crea un vector y amb els nombres parells del 2 al 16 9. Crea un vector x2 seleccionant els índexs parells del vector x 10. Crea un vector x4 seleccionant només els valors més grans que 4 de x 11. Guarda-ho tot al fitxer script1 de manera que puguis recuperar x,x1,x2 i x4 al tancar i tornar a obrir.
Pràctica 2: La pluviometria de Manresa
Data frames, operacions amb data frames, estadístics, histograma 1. Vés a la web del Servei Meteorològic de Catalunya (meteo.cat) i descarrega’t la sèrie climàtica de Manresa sobre la precipitació acumulada mensual. Pots seguir directament l’enllaç Sèries climàtiques des de 1950 - Servei Meteorològic de Catalunya | Meteocat 2. Carrega aquest fitxer de dades a R, editant-lo si és necessari per a que tingui el format adequat, en un objecte (dataframe) de nom pluvi. 3. Crea un vector de nom anual amb la precipitació total anual per a cadascun dels anys de la sèrie. Afegeix la columna ANUAL a pluvi amb el contingut del vector anual. 4. Calcula la mitjana, el rang, mediana i els quartils de la precipitació total anual. 5. Quin ha estat l’any més sec i quan va ploure? I el més humit? 6. Fes un histograma de la precipitació total anual. Modifica l’histograma de manera que vagi de 100 a 1000 en classes de 100, i que les barres siguin blaves. 7. Analitza la pluviometria de Manresa a partir de l’histograma anterior. 2 8. Quants anys han tingut una pluviometria menor que 400 𝑙/𝑚 . Quin percentatge 2 d’anys tenen una pluviometria entre 450 i 550 𝑙/𝑚 ? 9. Crea una nova taula amb les 4 columnes primavera, estiu, tardor, hivern, de manera que la primavera contingui la suma dels mesos març, abril i maig, estiu els mesos juny, juliol i agost, tardor tingui setembre, octubre i novembre i hivern desembre, gener i febrer. 10. Crea un gràfic amb el diagrama de caixes de la pluviometria de les quatre estacions. 11. Calcula la variància, quasi-variància, desviació típica i quasi-desviació típica de les quatre estacions. 12. Quina és la més seca? i humida? Quina és la més variable?
Pràctica 3: COVID al Bages
Importació i operacions amb data frames, gràfic de línia, gràfic de sectors
1. Descarrega’t el fitxer COVID-BAGES.csv del curs de l’Atenea en el directori del
projecte. 2. Quin percentatge de casos tenim per cada sexe? 3. Crea un nou dataframe que sumi el total de casos per cada dia. 4. Crea un gràfic del total de casos de COVID al Bages al llarg del temps. 5. Crea un gràfic de sectors que conti el percentatge dels casos per tipus de detecció 6. Quin percentatge de casos són a Manresa? Crea un nou dataframe que sumi el total de casos diaris només a Manresa 7. Afegeix els casos de manresa al gràfic total del Bages.
Pràctica 4: Gas i PIB
Funcions. Manipulació de cadenes. Regressió lineal. Importació de dades i operacionis amb data frames. 1. Descarrega el fitxer gas-auto-cat.tsv, que conté el consum de gasolines i gasoils per automoció a catalunya. 2. Importa les dades del fitxer. Compte amb el format dels nombres! 3. Crea una funció right(x,n) que extreu els n darrers caracters d’un string. right(“abcde”, 2) => “de”. 4. Crea una nova taula amb les dades anualitzades només per als anys complets, amb una columna per la suma dels dos tipus de combustible. 5. Descarrega i importa el fitxer pib-cat.csv, que conté el Producte Interior Brut de Catalunya anual en milions d’euros. 6. Filtra la mostra de manera que descartem els anys pels que no tenim les dues variables. 7. Fes el gràfic de punts entre les dues variables 8. Calcula la recta de regressió i el coeficient de correlació lineal.