knitr::opts_chunk$set( collapse = TRUE, comment = "#>", echo = TRUE )
f(g(x))
g(x) %>% f()
{width=30%}
set.seed(7895) hist(rnorm(10))
library(magrittr) set.seed(7895) rnorm(10) %>% hist()
Charger le package dplyr
...
library(dplyr) # ou require(dplyr)
Ou bien charger tidyverse
...
library(tidyverse)
... mais cela chargera d'autres packages en plus
Et charger les données.
data("fruits", package = "tidyViz")
Les données sont au format "tibble" : c'est comme des "data-frames" mais en mieux !
fruits
Nous allons voir ensemble quelques fonctions très pratiques de la librairie dplyr
.
# | Fonction (US) | Fonction (UK) | Description
---|:-------------:|:-------------:|:----------
1 | mutate
| mutate
| Créer ou modifier des colonnes
2 | select
| select
| Sélectionner des colonnes
3 | arrange
| arrange
| Trier les lignes
4 | filter
| filter
| Sélectionner des lignes
5 | group_by
| group_by
| Grouper des lignes
6 | summarize
| summarise
| Résumer des groupes
Avec la fonction mutate
.
fruits2 <- fruits %>% mutate(Sucres_ratio = Sucres / 100) head(fruits2[, "Sucres_ratio"])
Avec les fonctions classiques.
fruits2 <- fruits fruits2$Sucres_ratio <- fruits2$Sucres / 100 head(fruits2[, "Sucres_ratio"])
Avec la fonction select
.
fruits %>% select( Energie, Sucres, Lipides, Proteines)
Avec les fonctions classiques.
fruits[, c( "Energie", "Sucres", "Lipides", "Proteines")]
Avec les fonctions arrange
et desc
.
fruits %>% select(Energie, Sucres, Fibres) %>% arrange(desc(Fibres))
Avec les fonctions classiques
fruits[ order(fruits$Fibres, decreasing = TRUE), c("Energie", "Sucres", "Fibres")]
Avec la fonction filter
.
fruits %>% filter(Sucres > 60)
Avec les fonctions classiques.
fruits[fruits$Sucres > 60, ]
Avec la fonction group_by
:
fruits %>% group_by(groupe)
Les données sont prêtes à être "traitées" groupe par groupe.
PS : L'opération ungroup()
permet d'enlever les groupes.
Avec la fonction summarize
.
fruits %>% group_by(groupe) %>% summarize(SucreMoyen = mean(Sucres))
Avec les fonctions classiques.
aggregate(fruits$Sucres, by = list(fruits$groupe), FUN = mean)
Calculer l'énergie moyenne, la teneur en sucres médiane et le maximum de la teneur en Fibres par groupe de fruits et trier le tout par ordre décroissant du maximum de la teneur en Fibres !
Sélectionne Ne sélectionne pas
Ne transforme pas select
rename
Peut transformer transmute
mutate
{width=100%}
{width=50%}
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.