Pacote {genderBR}

O pacote {genderBR}, do R, permite extrair o sexo presumido a partir de um nome. Com isso, é possível fazer análises sobre viés de decisão pelo sexo presumido de pessoas da magistratura, por exemplo.

Exemplo de aplicação

O código abaixo faz uma tabela com a quantidade total de decisões e a quantidade de decisões reformadas de

tabela <- tjsp2inst::tjsp2inst |> 
  # considera apenas decisões de mérito e área cível
  dplyr::filter(
    dec_val %in% c("Reformou", "Não reformou", "Parcial"),
    info_area == "Cível"
  ) |>
  # considera apenas relatores com mais de 1500 decisões
  dplyr::group_by(info_relator) |> 
  dplyr::filter(dplyr::n() > 1500) |> 
  # calcula as contagens
  dplyr::summarise(
    n_reformou = sum(dec_val %in% c("Reformou", "Parcial")),
    n_total = dplyr::n()
  )

head(tabela)

#> # A tibble: 6 × 3
#>   info_relator         n_reformou n_total
#>   <fct>                     <int>   <int>
#> 1 ACHILE ALESINA              581    1595
#> 2 AFONSO BRAZ                 572    1631
#> 3 ALVARO TORRES JUNIOR        689    1591
#> 4 ANDRADE NETO                723    1724
#> 5 ARANTES THEODORO            614    1575
#> 6 BEATRIZ BRAGA               507    1710
#> ...

Agora, vamos fazer uma tabela por sexo presumido. Note que nem sempre o pacote consegue identificar com precisão suficiente.

tabela_sexo <- tabela |> 
  # estima o sexo presumido
  dplyr::mutate(
    sexo_presumido = genderBR::get_gender(as.character(info_relator))
  ) |> 
  # agrupa pelo sexo presumido e soma as decisões
  dplyr::group_by(sexo_presumido) |> 
  dplyr::summarise(
    n_reformou = sum(n_reformou),
    n_total = sum(n_total)
  ) |> 
  # calcula taxa de reforma
  dplyr::mutate(taxa_reforma = formattable::percent(n_reformou / n_total))

knitr::kable(tabela_sexo)
sexo_presumido n_reformou n_total taxa_reforma
Female 5605 13890 40.35%
Male 49080 113596 43.21%
NA 6648 15599 42.62%

Na tabela, identificamos uma proporção um pouco maior de reforma em relatores com sexo presumido masculino. Claro que existem diversos fatores que podem explicar a diferença, como o tipo de câmara, antiguidade, entre outras.

Que outras análises você faria com esse pacote?