从文本JavaScript中删除HTML

有没有一种简单的方法可以在JavaScript中获取一个html字符串并去掉html？

当前回答

要获得更简单的解决方案，请尝试此=>https://css-tricks.com/snippets/javascript/strip-html-tags-in-javascript/

var StrippedString = OriginalString.replace(/(<([^>]+)>)/ig,"");

2020-04-07 13:33:59

其他回答

正如其他人所建议的，我建议尽可能使用DOMParser。

然而，如果您恰好在Node/JS Lambda内部工作，或者DOMParser不可用，我会使用下面的正则表达式来匹配前面的回答/评论中提到的大多数场景。它与$gt；不匹配；和$lt；正如其他一些人可能担心的那样，但应该捕捉到几乎任何其他场景。

const dangerousText = '?';
const htmlTagRegex = /<\/?([a-zA-Z]\s?)*?([a-zA-Z]+?=\s?".*")*?([\s/]*?)>/gi;
const sanitizedText = dangerousText.replace(htmlTagRegex, '');

这可能很容易简化，但它应该适用于大多数情况。希望这对某人有所帮助。

2022-04-05 22:01:49

要获得更简单的解决方案，请尝试此=>https://css-tricks.com/snippets/javascript/strip-html-tags-in-javascript/

var StrippedString = OriginalString.replace(/(<([^>]+)>)/ig,"");

2020-04-07 13:33:59

我想分享一下Shog9批准答案的编辑版本。

正如Mike Samuel在评论中指出的那样，该函数可以执行内联javascript代码。但Shog9说“让浏览器为你做……”是对的

所以…这里是我的编辑版本，使用DOMParser：

function strip(html){
   let doc = new DOMParser().parseFromString(html, 'text/html');
   return doc.body.textContent || "";
}

这里是测试内联javascript的代码：

strip("<img onerror='alert(\"could run arbitrary JS here\")' src=bogus>")

此外，它不会在解析时请求资源（如图像）

strip("Just text <img src='https://assets.rbl.ms/4155638/980x.jpg'>")

2017-11-06 15:46:44

我认为最简单的方法就是像上面提到的那样使用正则表达式。虽然没有理由使用一堆。尝试：

stringWithHTML = stringWithHTML.replace(/<\/?[a-z][a-z0-9]*[^<>]*>/ig, "");

2011-01-10 05:40:34

使用Jquery：

function stripTags() {
    return $('<p></p>').html(textToEscape).text()
}

2016-12-09 08:41:42

从文本JavaScript中删除HTML

推荐文章

最新文章

标签