从文本JavaScript中删除HTML

有没有一种简单的方法可以在JavaScript中获取一个html字符串并去掉html？

当前回答

很多人已经回答了这个问题，但我认为分享我编写的函数可能会有用，该函数可以从字符串中删除HTML标记，但允许您包含一个不希望删除的标记数组。它很短，对我来说一直很好。

function removeTags(string, array){
  return array ? string.split("<").filter(function(val){ return f(array, val); }).map(function(val){ return f(array, val); }).join("") : string.split("<").map(function(d){ return d.split(">").pop(); }).join("");
  function f(array, value){
    return array.map(function(d){ return value.includes(d + ">"); }).indexOf(true) != -1 ? "<" + value : value.split(">")[1];
  }
}

var x = "<span><i>Hello</i> <b>world</b>!</span>";
console.log(removeTags(x)); // Hello world!
console.log(removeTags(x, ["span", "i"])); // <span><i>Hello</i> world!</span>

2017-01-27 06:55:53

其他回答

function strip_html_tags(str)
{
   if ((str===null) || (str===''))
       return false;
  else
   str = str.toString();
  return str.replace(/<[^>]*>/g, '');
}

2018-07-04 21:59:23

myString.replace(/<[^>]*>?/gm, '');

2009-05-04 22:42:52

对公认答案的改进。

function strip(html)
{
   var tmp = document.implementation.createHTMLDocument("New").body;
   tmp.innerHTML = html;
   return tmp.textContent || tmp.innerText || "";
}

这样一来，像这样运行的东西不会造成任何伤害：

strip("<img onerror='alert(\"could run arbitrary JS here\")' src=bogus>")

Firefox、Chromium和Explorer 9+是安全的。歌剧院普雷斯托仍然很脆弱。字符串中提到的图像也不会在Chromium和Firefox中保存http请求。

2013-07-31 20:14:59

这个包非常适合剥离HTML：https://www.npmjs.com/package/string-strip-html

它可以在浏览器和服务器（例如Node.js）上工作。

2021-07-11 08:13:33

作为jQuery方法的扩展，如果字符串可能不包含HTML（例如，如果您试图从表单字段中删除HTML）

jQuery(html).text();

如果没有HTML，将返回空字符串

Use:

jQuery('<p>' + html + '</p>').text();

相反

更新：正如评论中所指出的，在某些情况下，如果攻击者可能影响html的值，则此解决方案将执行html中包含的javascript，请使用不同的解决方案。

2013-01-15 12:20:49

从文本JavaScript中删除HTML

推荐文章

最新文章

标签