我正在开发一个项目,允许用户执行字符串的动态正则表达式替换。主要“操作模式”旨在如下:
(foo)
) 的搜索字符串$1
、$2
、...)printf
字符串格式),这与输入字符串的格式相反。因此,例如,预期会出现以下参数/输出:
abc def ghi jkl mno
(\S+) ghi (\S+)
$1 - $2
def - jkl
(*) “替换”一词似乎会让一些人感到困惑。需要澄清的是,这与 替换模式 完全相同,例如用于x.replace()
,但更像是一种格式化/输出模式,或者更详细地说:您从头开始构建一个全新字符串的模式,使用对您捕获的子字符串的引用搜索模式,忽略原始输入字符串中的任何其他文本。换句话说,它不是内联替换,而是完全替换。
这背后的想法是,用户只需输入最低限度的模式即可捕获他们想要的确切部分,而不是(通常)将替换中省略的部分包含在搜索模式中。
在上面的示例中,只需添加 .*
到 Search 参数的开头和结尾并使用 String.prototype.replace()
基本上可以做到这一点。然而,操纵用户提供的原始搜索字符串似乎不是最好的主意,并且容易出现很多问题,因为正则表达式模式可能非常复杂。
所以,我想知道在 JavaScript 中是否有现成可用的内部实用函数/方法来安全地执行这种正则表达式字符串转换?我环顾四周,但也许我只是没有使用正确的关键字……即使没有主要使用核心 JavaScript 函数的优雅方法,当然也欢迎其他(安全!)方法。
最佳答案
支持变量的最简单方法,例如 $$
, $`
, $'
, $@
, $<name>
, $1
, $2
等是使用RegExp.prototype.exec
功能。
注意:如果使用“全局”标志,g
, 然后是 $`
和 $'
替换可能不是特别有意义。
function replace(regex, flags, s, replacement)
{
try {
let matches = [];
let prefix;
let suffix;
let groups;
let firstTime = true;
const re = new RegExp(regex, flags);
for (;;) {
const m = re.exec(s);
let i;
if (firstTime) {
if (m === null)
return null;
groups = m.groups;
i = 0;
prefix = s.substring(0, m.index);
suffix = s.substring(m.index + m[0].length);
firstTime = false;
}
else if (m === null)
break;
else
i = 1;
for (; i < m.length; ++i)
matches.push(m[i]);
if (re.lastIndex === 0)
break; // global flag not specified
}
let results = [];
const l = replacement.length;
for (let index = 0; index < l;) {
let ch = replacement[index++];
if (ch != '$') {
results.push(ch);
}
else if (index == l) // invalid
return null;
else {
ch = replacement[index++];
// saw '$'
switch (ch) {
case '$':
results.push('$');
break;
case '@':
results.push(matches[0]);
break;
case '`':
results.push(prefix);
break;
case "'":
results.push(suffix);
break;
default:
index -= 1;
const m2 = /(\d+)|<([^>]+)>/.exec(replacement.substring(index));
if (m2 === null)
return null;
index += m2[0].length;
if (typeof m2[1] != 'undefined')
results.push(matches[parseInt(m2[1])]);
else if (typeof(m2[2] != 'undefined'))
results.push(groups[m2[2]]);
else
return null;
}
}
}
return results.join('');
}
catch (e)
{
console.log(e);
return null;
}
}
const s = 'abc def ghi jkl mno';
const search1 = '(\\S+) ghi (\\S+)';
const search2 = '(?<s1>\\S+) ghi (?<s2>\\S\+)';
const search3 = '(\\w+)';
console.log(replace(search1, '', s, '$1 - $2')); // -> 'def - jkl'
console.log(replace(search2, '', s, '$<s1> - $<s2>')); // -> 'def jkl'
console.log(replace(search1, '', s, "$`-$'")); // -> 'abc - mno'
console.log(replace(search1, '', s, "$@")); // -> 'def ghi jkl'
console.log(replace(search1, '', s, "$$$1$2")); // -> '$defjkl'
console.log(replace(search3, 'g', s, "$5 $4 $3 $2 $1")); // -> 'mno jkl ghi def abc'
关于javascript - 我怎样才能从传递给 `String.prototype.replace` 的模板中获取替换文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72975000/