假设我有这样的数据,不幸的是,变量值嵌入在列名中:
library(tidyr)
library(dplyr)
dat <- tribble(
~group, ~var1, ~var_meta1, ~var2, ~var_meta2,
"group1", 5.2, "cat", 4.3, "dog"
)
dat
#> # A tibble: 1 x 5
#> group var1 var_meta1 var2 var_meta2
#> <chr> <dbl> <chr> <dbl> <chr>
#> 1 group1 5.2 cat 4.3 dog
我想将该数据转换为该数据,以便列名中的数字成为一个变量。同时,我想维护配对变量(var*
和 var_meta*
)之间的关系。
#> # A tibble: 2 x 4
#> group day var var_meta
#> <chr> <dbl> <dbl> <chr>
#> 1 group1 1 5.2 cat
#> 2 group1 2 4.3 dog
对于这种特殊情况,我真的只对 tidyr 解决方案感兴趣。我试过这个:
dat %>%
pivot_longer(-group,
names_to = c("day", "var", ".value"),
names_pattern = "([A-Za-z]+)_([A-Za-z]+)([0-9]+)"
)
#> # A tibble: 3 x 5
#> group day var `1` `2`
#> <chr> <chr> <chr> <chr> <chr>
#> 1 group1 <NA> <NA> <NA> <NA>
#> 2 group1 var meta cat dog
#> 3 group1 <NA> <NA> <NA> <NA>
还有这个:
dat %>%
mutate(across(contains("var"), as.character)) %>%
pivot_longer(-group,
names_to = c("type", ".value"),
names_pattern = "([A-Za-z]+)([0-9]+)"
)
#> # A tibble: 2 x 4
#> group type `1` `2`
#> <chr> <chr> <chr> <chr>
#> 1 group1 var 5.2 4.3
#> 2 group1 meta cat dog
我觉得我很接近,但我不能完全理解正则表达式(我认为)。
有什么想法吗?
最佳答案
一个选项可能是:
dat %>%
pivot_longer(-group,
names_to = c(".value", "day"),
names_pattern = "(\\D+)(\\d+)")
group day var var_meta
<chr> <chr> <dbl> <chr>
1 group1 1 5.2 cat
2 group1 2 4.3 dog
https://stackoverflow.com/questions/66499564/