Le package onbabynames

Mon deuxième package, onbabynames, vient tout juste d’arriver sur CRAN. Le package est en fait une base de données de tous les prénoms donnés aux enfants en Ontario entre 1917 et 2018. Les prénoms donnés moins de 5 fois ont été enlevés de la base de données pour conserver la confidentialité des données

Pour l’installer, rien de plus facile:

install.packages("onbabynames")

Vous pouvez ensuite l’utiliser comme ceci:

library(onbabynames)

Nous allons utiliser le package tidyverse pour visualiser les données:

# install.packages("tidyverse") si le package n'est pas encore installé
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.1.1     v dplyr   1.0.5
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Une base de données sous la forme d’un tibble sera maintenant accessible sous le noms de onbabynames.

glimpse(onbabynames)
## Rows: 161,703
## Columns: 4
## $ year <int> 1913, 1913, 1914, 1914, 1914, 1915, 1915, 1915, 1915, 1915, 1916,~
## $ sex  <chr> "F", "F", "F", "F", "F", "F", "F", "F", "F", "F", "F", "F", "F", ~
## $ name <chr> "Margaret", "Mary", "Gladys", "Margaret", "Mary", "Dorothy", "Mar~
## $ n    <int> 6, 7, 6, 9, 9, 9, 13, 10, 7, 7, 6, 8, 10, 6, 14, 12, 12, 7, 89, 6~
onbabynames
## # A tibble: 161,703 x 4
##     year sex   name         n
##    <int> <chr> <chr>    <int>
##  1  1913 F     Margaret     6
##  2  1913 F     Mary         7
##  3  1914 F     Gladys       6
##  4  1914 F     Margaret     9
##  5  1914 F     Mary         9
##  6  1915 F     Dorothy      9
##  7  1915 F     Margaret    13
##  8  1915 F     Marie       10
##  9  1915 F     Mary         7
## 10  1915 F     Ruth         7
## # ... with 161,693 more rows

Quelques exemples

Les 5 prénoms masculins les plus populaires en 2018

onbabynames %>% 
  filter(year == 2018 & sex == "M") %>% 
  arrange(desc(n)) %>% 
  head(5)
## # A tibble: 5 x 4
##    year sex   name         n
##   <int> <chr> <chr>    <int>
## 1  2018 M     Liam       795
## 2  2018 M     Noah       787
## 3  2018 M     Lucas      671
## 4  2018 M     William    660
## 5  2018 M     Benjamin   643

Les 5 prénoms féminins les plus populaires en 2018

onbabynames %>% 
  filter(year == 2018 & sex == "F") %>% 
  arrange(desc(n)) %>% 
  head(5)
## # A tibble: 5 x 4
##    year sex   name          n
##   <int> <chr> <chr>     <int>
## 1  2018 F     Olivia      863
## 2  2018 F     Emma        686
## 3  2018 F     Charlotte   682
## 4  2018 F     Amelia      560
## 5  2018 F     Ava         559

L’évolution de la popularité des cinq prénoms féminins les plus populaires en 218

girls2018 <- onbabynames %>%
    filter(year == 2018 & sex == "F") %>%
    arrange(desc(n)) %>%
    select(name) %>%
    head(5)

onbabynames %>%
    filter(name %in% girls2018$name) %>%
    ggplot(aes(x = year, y = n, color = name)) +
    geom_line()

Marc-André Désautels
Marc-André Désautels
Enseignant de mathématiques

Je m’intéresse particulièrement à la vulgarisation et à la promotion des mathématiques.