从文本JavaScript中删除HTML

有没有一种简单的方法可以在JavaScript中获取一个html字符串并去掉html？

当前回答

在尝试了所有提到的答案后，如果不是所有答案都有边缘案例，也不能完全支持我的需求。

我开始探索php是如何做到这一点的，并在这里遇到了复制strip_tags方法的php.js库：http://phpjs.org/functions/strip_tags/

2015-06-11 22:06:11

其他回答

这个包非常适合剥离HTML：https://www.npmjs.com/package/string-strip-html

它可以在浏览器和服务器（例如Node.js）上工作。

2021-07-11 08:13:33

在尝试了所有提到的答案后，如果不是所有答案都有边缘案例，也不能完全支持我的需求。

我开始探索php是如何做到这一点的，并在这里遇到了复制strip_tags方法的php.js库：http://phpjs.org/functions/strip_tags/

2015-06-11 22:06:11

对于转义字符，也可以使用模式匹配：

myString.replace(/((&lt)|(<)(?:.|\n)*?(&gt)|(>))/gm, '');

2016-11-08 10:44:34

const strip=(text) =>{
    return (new DOMParser()?.parseFromString(text,"text/html"))
    ?.body?.textContent
}

const value=document.getElementById("idOfEl").value

const cleanText=strip(value)

2022-01-19 08:53:18

正如其他人所建议的，我建议尽可能使用DOMParser。

然而，如果您恰好在Node/JS Lambda内部工作，或者DOMParser不可用，我会使用下面的正则表达式来匹配前面的回答/评论中提到的大多数场景。它与$gt；不匹配；和$lt；正如其他一些人可能担心的那样，但应该捕捉到几乎任何其他场景。

const dangerousText = '?';
const htmlTagRegex = /<\/?([a-zA-Z]\s?)*?([a-zA-Z]+?=\s?".*")*?([\s/]*?)>/gi;
const sanitizedText = dangerousText.replace(htmlTagRegex, '');

这可能很容易简化，但它应该适用于大多数情况。希望这对某人有所帮助。

2022-04-05 22:01:49

从文本JavaScript中删除HTML

推荐文章

最新文章

标签