Ha salido un nuevo paquete para mostrar distribuciones de una manera que a mi me parece muy bonita. Se trata de ggdist, un ‘escición’ de tidybayes. Veamos que podemos hacer con él. Me interesa mostrar las distribuciones de diferentes variables en forma de percentiles.

Primero de todo vamos a cargar unos datos. Como sabéis, tengo tirria a los clásicos Iris y mtcars. Vamos a probar con el simpático “penguins”


remotes::install_github("allisonhorst/palmerpenguins")
pacman::p_load(palmerpenguins, tidyverse, ggdist, see , wesanderson)
df <- penguins
df <- df[complete.cases(df),]

Primero de todo vamos a convertir en long nuestros datos

df <- df %>%  pivot_longer(cols = 3:6, names_to = "index")

Ahora sí, a plotear! Primero de todo vamos a hacer lo mínimo. El gráfico básico con los valores que queremos mostrar usando el geom stat_dots especificando los 100 cuantiles. Para que aparezca en cada variable usaremos el facet_wrap con su respectivo scale = “free”.


df %>%
  ggplot(aes(x = value)) +
  stat_dots(quantiles = 100) +
  facet_wrap(~index, scale = "free")
  
  
  

Un vez con nuestro lienzo básico, vamos a darle un poco de alegría.


df %>% 
  ggplot(aes(x = value,  color = sex, fill = sex)) +
  stat_dots(quantiles = 100, alpha = .50, shape = 19)+
  facet_wrap(~index, scale = "free") + 
  theme_modern()  + 
  scale_color_manual(values=c("#56B4E9", "#E69F00" ))

Aún quedaría mucho por tocar para hacer uno gráficos publicables, pero he cumplido con lo que me propuse: tener une ejemplode gráficos de cuantiles