我有一组字符向量:
a <- "bmi + ch | study"
b <- "bmi * ch | study"
c <- "bmi * ch - 1 | study"
d <- "bmi * ch + 0 | study"
e <- "bmi:ch + 0 | study"
在此示例中,我想提取两个字符串 "bmi"
和 "ch"
,即所需的输出是 c("bmi", "ch")
上面的字符串只是例子;要提取的字符元素可以是 ch
和 bmi
以外的任何其他元素。我正在寻找无需硬编码的通用解决方案。
我试过 unlist(stringr::str_extract_all(a, "bmi|ch"))
。但是,这里我手动定义模式 "bmi|ch"
以实现所需的输出。因此,这不是一个通用的解决方案。
最佳答案
假设最后的注释中定义了向量v。然后我们可以使用指示的函数对其进行 lapply。如果变量的数量始终相同,您可以交替使用 sapply 给出矩阵。
lapply(sub("\\|.*", "", v), function(x) all.vars(parse(text = x)))
给予:
[[1]]
[1] "bmi" "ch"
[[2]]
[1] "bmi" "ch"
[[3]]
[1] "bmi" "ch"
[[4]]
[1] "bmi" "ch"
[[5]]
[1] "bmi" "ch"
a <- "bmi + ch | study"
b <- "bmi * ch | study"
c <- "bmi * ch - 1 | study"
d <- "bmi * ch + 0 | study"
e <- "bmi:ch + 0 | study"
v <- c(a, b, c, d, e)
https://stackoverflow.com/questions/70551416/