session_5.Rmd

title: "R#5: Pipping and grouping"
author: "Laurent Modolo [laurent.modolo@ens-lyon.fr](mailto:laurent.modolo@ens-lyon.fr)"
date: "2022"
output:
  rmdformats::downcute:
    self_contain: true
    use_bookdown: true
    default_style: "light"
    lightbox: true
    css: "../www/style_Rmd.css"
library(fontawesome)
rm(list=ls())
knitr::opts_chunk$set(echo = TRUE)
knitr::opts_chunk$set(comment = NA)
klippy::klippy(
  position = c('top', 'right'),
  color = "white",
  tooltip_message = 'Click to copy',
  tooltip_success = 'Copied !')
flights %>%
  mutate(delay = mean(dep_delay, na.rm = TRUE))
flights %>%
  summarise(delay = mean(dep_delay, na.rm = TRUE))
flights_delay <- flights %>%
  group_by(year, month) %>%
  summarise(delay = mean(dep_delay, na.rm = TRUE), sd = sd(dep_delay, na.rm = TRUE)) %>%
  arrange(month)

ggplot(data = flights_delay, mapping = aes(x = month, y = delay)) +
  geom_bar(stat="identity", color="black", fill = "#619CFF") +
  geom_errorbar(mapping = aes( ymin=0, ymax=delay+sd)) +
  theme(axis.text.x = element_blank())
flights %>%
  group_by(dest) %>%
  summarise(
    dist = mean(distance),
    delay = mean(arr_delay)
  )
summ_delay_filghts <- flights %>%
  group_by(dest) %>%
  summarise(
    count = n(),
    dist = mean(distance, na.rm = TRUE),
    delay = mean(arr_delay, na.rm = TRUE)
  ) %>%
  filter(dest != "HNL") %>%
  filter(delay < 40 & delay > -20)

ggplot(data = summ_delay_filghts, mapping = aes(x = dist, y = delay, size = count)) +
  geom_point() +
  geom_smooth(method = lm, se = FALSE) +
  theme(legend.position='none')
flights %>%
  group_by(year, month, day) %>%
  ungroup() %>%
  summarise(delay = mean(dep_delay, na.rm = TRUE))