Professional Documents
Culture Documents
R - Partie 1
R - Partie 1
Python & R
ENSA de Kenitra
Le nom d’une variable ou un objet en R est une suite non vide de caractères,
formée d’un caractère de début (n’importe quelle lettre), puis zéro ou plusieurs
caractères de continuation (lettre, caractère souligné ou chiffre)
Une donnée manquante ou non définie est indiquée par l'instruction NA (pour non
available = non disponible).
(*) R considère ce type de données comme étant une valeur logique constante.
EXEMPLE
R offre la possibilité de travailler directement avec des octets (affichés sous forme
hexadécimale), c’est intéressant lors du travail sur les fichiers binaires.
EXEMPLE
Toute information mise entre guillemets (simple ' ou double ") correspond à une chaîne de
caractères.
EXEMPLE CONVERSION
La conversion des types entre chaines de caractère et
d’autres types, est possible grace aux fonctions as.numeric,
as.character…
EXEMPLE
CONCEPTS DE BASE
STRUCTURE DE DONNEE
Les structures de donnée sont des collections des données de même type ou pas. En R,
nous avons : Vecteur, les tableaux et matrices, les facteurs, les listes, les Data.frame.
Les chaînes de caractères sont des variables catégorielles, qui peuvent être définit avec la
fonction factor(), pour permettre d’extraire les différents niveaux avec la fonction levels(). Pour
les chaines qui suivent un certain ordre conventionnel,on les définit avec ordered().
CONCEPTS DE BASE
EXEMPLE
VECTEUR
CONCEPTS DE BASE
EXEMPLE
Matrices et Tableaux
CONCEPTS DE BASE
EXEMPLE
Liste
CONCEPTS DE BASE
EXEMPLE
Facteur
CONCEPTS DE BASE
EXEMPLE
CONCEPTS DE BASE
TP
LA PROGRAMMATION R– PARTIE 1
1 – Concepts de base
2- Manipulation des données
3-Graphiques
4-Script R
5-Packages
MANIPULATION DES DONNÉES
La manipulation des données ou objets sous R, se fait grâce à une série de fonction qui
permettent d’effectuer les opérations ci-dessous sur un ou plusieurs objets (données) :
Création des objets
Suppression des objets
Affichage
Suppression des éléments d’objet
Extraction
Concaténation
Trie
Obtenir des informations sur la structure des données et typologie des objets
Nommer les colonnes
Les calculs arithmétique, calculs matriciels
Saisie des données
Import/Export
….
MANIPULATION DES DONNÉES
GENERALITE
MATRICE
CALCUL MATRICIEL
EXEMPLE
MANIPULATION DES DONNÉES
OPERATIONS LOGIQUES ET RELATIONNELLES
OPERATIONS ENSEMBLISTE
MANIPULATION DES DONNÉES
La création d’une chaine de caractère se fait par les simples ou doubles quotes « ‘ »
La fonction nchar() permet de calculer le nombre des caractères dans un objet chaines
de caractères
Les fonctions letters() et LETTERS() renvoie les caractères de l’alphabet
La fonction paste() permet la concaténation des chaines
La fonction substring(), substr() permet d’extraire des sous-chaines d’une chaine
La fonction strsplit() permet de découper une chaine
La fonction grep() permet de rechercher un motif dans une chaine
La fonction gsub() permet de remplacer un motif dans une chaine
La fonction sub() permet de remplacer la première occurrence d’un motif dans une
chaine
Les fonctions tolower() & toupper() pour transformer les majuscules et minuscules.
MANIPULATION DES DONNÉES
EXEMPLE
MANIPULATION DES DONNÉES
MANIPULATION DES DATES
Les fonctions Sys.Date() et date() permet de récupérer la date du jour.
Les fonctions qui permet de manipuler les dates : strptime(), qui renvoie un objet
contenant une date selon le format
MANIPULATION DES DONNÉES
EXEMPLE
MANIPULATION DES DONNÉES
EXEMPLE
MANIPULATION DES DONNÉES
Pour lire à partir d’un fichier excel (.xls) , on utilise des packages spécifiques exemple : «
gdata » avec la fonction « read.xls() ».
R permet d’importer des données depuis d’autres sources : SPSS, Minitab, SAS ou
MATLAB
MANIPULATION DES DONNÉES
EXEMPLE
LA PROGRAMMATION R– PARTIE 1
1 – Concepts de base
2- Manipulation des données
3-Graphiques
4-Script R
5-Packages
GRAPHIQUES
FONCTION DE BASE : plot() & points()
La fonction plot() est la fonction générique pour tracer des graphiques. Elle prend
comme paramètre d'entrée les coordonnées des points à tracer.
La fonction points() permet en plus de générer les graphiques comme la fonction plot(),
il permet de superposer les graphiques.
EXEMPLE
GRAPHIQUES
FONCTIONS : segment(), lines(), abline(), arrows(), box() et colors()
Les fonctions segments() et lines() permettent de joindre des points par des segments de
ligne qui sont ajoutés à un graphique préexistant.
La fonction abline() permet soit de tracer une droite d'équation y = a + bx (spécifiée par les
paramètres a et b), soit de tracer une ligne horizontale (paramètre h) ou verticale (paramètre v).
La fonction arrows() permet de tracer des flèches reliant des paires de points. Elle comprend
un paramètre length permettant d'indiquer la taille de la pointe de la flèche.
La fonction box() permet d'ajouter une boîte autour du graphique courant.
Le paramètre « col » de la fonction plot() permet de changer les couleurs, R dispose de plus
de 650 couleurs qu’on peut consulter par la fonction colors()
EXEMPLE
GRAPHIQUES
EXEMPLE
GRAPHIQUES
FONCTION : text()
La fonction text () permet d'ajouter du texte sur un graphique. Elle permet aussi, d'y ajouter
des formules mathématiques. Il faut donner les coordonnées en x et en y du centre de la chaîne
de caractères à afficher.
La fonction expression () permet d’écrire une expression mathématique.
La fonction mtext () permet d'ajouter du texte dans les marges de la fenêtre graphique
EXEMPLE
GRAPHIQUES
FONCTION : legend()
La fonction legend () est utilisée pour ajouter une légende à un graphique existant.
EXEMPLE
GRAPHIQUES
FONCTION : par()
La fonction par() est une fonction qui possède de très nombreux paramètres vous permettant
d’améliorer les graphiques.
- par("nom-paramètre") renvoie la valeur par défaut du paramètre nomparamètre
- par("nom-paramètre"=val) permet d'attribuer au paramètre nomparamètre la valeur val
- par() renvoie la liste de tous les paramètres graphiques en cours ainsi que leur valeur.
EXEMPLE
En plus des fonctions de base, R dispose des packages pour la génération et manipulation
des graphiques :
ggplot2, améliore l’esthétique des graphiques, produit des graphiques multivariées, et
introduit de nouvelles fonctionnalités en simplifiant l’utilisation
plotly, permet de manipuler des graphiques interactives aux actions des utilisateurs
maps et mapdata, permet de manipuler des cartes géographiques
rgl, permet de générer des graphiques 3D
lattice, permet de produire des graphiques conditionnels à la valeur d’un ou de
plusieurs facteurs (graphiques multivariées)
GRAPHIQUES
PACKAGES POUR LES GRAPHIQUES SOUS R
GRAPHIQUES
PACKAGES POUR LES GRAPHIQUES SOUS R
GRAPHIQUES
PACKAGES POUR LES GRAPHIQUES SOUS R
Sauvegarder le graphique
avec la fonction ggsave()
GRAPHIQUES
PACKAGES POUR LES GRAPHIQUES SOUS R
TP
LA PROGRAMMATION R– PARTIE 1
1 – Concepts de base
2- Manipulation des données
3-Graphiques
4-Script R
5-Packages
SCRIPT R
DEFINITION
Sous RStudio, nous avons deux manières pour éditer les
commandes :
Mode console pour les commandes en interactive
Mode scripting pour éditer des programmes en R
Le mode script permet de développer des programmes en R, pour
un usage ultérieur ou pour répondre à une problématique
d’automatisation du traitement et d’analyse des données très
fréquent.
SWITCH
IF-ELSE
EXEMPLE
SCRIPT R
SYNTAXE
EXEMPLE
SCRIPT R
FONCTION
La déclaration d'une fonction se fait selon la forme générale
suivante:
EXEMPLE
Appel
SCRIPT R
EXEMPLE
FONCTION
Pour déclarer une fonction avec des paramètres par défaut, il suffit
de les nommer au niveau de l’entête de la fonction et affecter une
valeur par défaut. Lors de l’appel, si les paramètres sont initialisé, il
Déclaration vont être utiliser, sinon les valeurs par défaut vont être affecter.
EXEMPLE
Définition
Appel
SCRIPT R
FONCTION
Pour définir une valeur de retour de la fonction, on utilise la
fonction return(). puis lors de l’appel affecter la fonction dans un
Déclaration objet.
EXEMPLE
Définition
Appel
EXERCICES
TP
LA PROGRAMMATION R– PARTIE 1
1 – Concepts de base
2- Manipulation des données
3-Graphiques
4-Script R
5-Packages
PACKAGE R
PACKAGE
Un package est un ensemble de données et de fonctions regroupées autour d'un même
thème.
Pour installer un package on utilise la fonction : install.packages() , puis il faut le charger par
la fonction library() ou require()
R dispose d’un nombre important de package plus de 15000 packages qui couvrent plusieurs
domaines et fonctionnalités
Le lien des packages officiels : https://cran.r-project.org/web/packages/
PACKAGE R
Package
Pour consulter les Datasets disponible pour R, la fonction datasets-package() permet de
consulter la liste des dataset disponible sur la machine
RMySQL, RPostgresSQL, RSQLite : pour lire depuis les bases de données MySQL,
PostgresSQL, SQLite.
dyplr : pour la manipulation des données
Stringr : pour le traitement des chaines de caractères
GoogleVis : pour la visualisation des graphiques de google
R Markdown, Shiny : pour reporting sur un support Web
Maps, ggmap, maptools, sp : pour la manipulation des cartes géographiques
xts : pour les séries temporelles
XML, jsonlite : pour le traitement des fichiers XML et json
devtools : pour la création de nouveau package
…..