session_5.Rmd

title: "R.5: Pipping and grouping"
author: "Laurent Modolo [laurent.modolo@ens-lyon.fr](mailto:laurent.modolo@ens-lyon.fr)"
date: "2022"
library(fontawesome)

if("conflicted" %in% .packages())
    conflicted::conflicts_prefer(dplyr::filter)
rm(list=ls())
knitr::opts_chunk$set(echo = TRUE)
knitr::opts_chunk$set(comment = NA)
flights %>%
  mutate(delay = mean(dep_delay, na.rm = TRUE))
flights %>%
  summarise(delay = mean(dep_delay, na.rm = TRUE))
flights_delay <- flights %>%
  group_by(year, month) %>%
  summarise(delay = mean(dep_delay, na.rm = TRUE), sd = sd(dep_delay, na.rm = TRUE)) %>%
  arrange(month)

ggplot(data = flights_delay, mapping = aes(x = month, y = delay)) +
  geom_bar(stat="identity", color="black", fill = "#619CFF") +
  geom_errorbar(mapping = aes( ymin=0, ymax=delay+sd)) +
  theme(axis.text.x = element_blank())
flights %>%
  group_by(dest) %>%
  summarise(
    dist = mean(distance),
    delay = mean(arr_delay)
  )
summ_delay_filghts <- flights %>%
  group_by(dest) %>%
  summarise(
    n_flights = n(),
    avg_distance = mean(distance, na.rm = TRUE),
    avg_delay = mean(arr_delay, na.rm = TRUE)
  ) %>%
  filter(dest != "HNL") %>%
  filter(avg_delay < 40 & avg_delay > -20)

ggplot(summ_delay_filghts, mapping = aes(x = avg_distance, y = avg_delay, size = n_flights)) +
  geom_point() +
  geom_smooth(method = lm, se = FALSE) +
  theme(legend.position='none')
flights %>%
  group_by(year, month, day) %>%
  ungroup() %>%
  summarise(delay = mean(dep_delay, na.rm = TRUE))