从文本JavaScript中删除HTML

有没有一种简单的方法可以在JavaScript中获取一个html字符串并去掉html？

当前回答

如果你在浏览器中运行，那么最简单的方法就是让浏览器为你做。。。

function stripHtml(html)
{
   let tmp = document.createElement("DIV");
   tmp.innerHTML = html;
   return tmp.textContent || tmp.innerText || "";
}

注意：正如人们在评论中所指出的，如果您不控制HTML的源代码（例如，不要在可能来自用户输入的任何内容上运行此代码），最好避免这种情况。对于这些场景，您仍然可以让浏览器为您完成工作-请参阅Saba关于使用现在广泛可用的DOMParser的回答。

2009-05-04 22:48:21

其他回答

function stripHTML(my_string){
    var charArr   = my_string.split(''),
        resultArr = [],
        htmlZone  = 0,
        quoteZone = 0;
    for( x=0; x < charArr.length; x++ ){
     switch( charArr[x] + htmlZone + quoteZone ){
       case "<00" : htmlZone  = 1;break;
       case ">10" : htmlZone  = 0;resultArr.push(' ');break;
       case '"10' : quoteZone = 1;break;
       case "'10" : quoteZone = 2;break;
       case '"11' : 
       case "'12" : quoteZone = 0;break;
       default    : if(!htmlZone){ resultArr.push(charArr[x]); }
     }
    }
    return resultArr.join('');
}

在新创建的dom元素中说明>内部属性和<img oneror=“javascript”>。

用法：

clean_string = stripHTML("string with <html> in it")

演示：

https://jsfiddle.net/gaby_de_wilde/pqayphzd/

做可怕事情的顶级答案演示：

https://jsfiddle.net/gaby_de_wilde/6f0jymL6/1/

2015-12-29 18:46:15

myString.replace(/<[^>]*>?/gm, '');

2009-05-04 22:42:52

https://developer.mozilla.org/en-US/docs/Web/API/Element/insertAdjacentHTML

var div = document.getElementsByTagName('div');
for (var i=0; i<div.length; i++) {
    div[i].insertAdjacentHTML('afterend', div[i].innerHTML);
    document.body.removeChild(div[i]);
}

2019-02-09 12:48:26

大多数情况下，接受的答案都很好，但是在IE中，如果html字符串为空，则会得到“null”（而不是“”）。固定的：

function strip(html)
{
   if (html == null) return "";
   var tmp = document.createElement("DIV");
   tmp.innerHTML = html;
   return tmp.textContent || tmp.innerText || "";
}

2016-05-27 00:12:48

方法1：

function cleanHTML(str){
  str.replace(/<(?<=<)(.*?)(?=>)>/g, '&lt;$1&gt;');
}

function uncleanHTML(str){
  str.replace(/&lt;(?<=&lt;)(.*?)(?=&gt;)&gt;/g, '<$1>');
}

方法2：

function cleanHTML(str){
  str.replace(/</g, '&lt;').replace(/>/g, '&gt;');
}

function uncleanHTML(str){
  str.replace(/&lt;/g, '<').replace(/&gt;/g, '>');
}

此外，不要忘记，如果用户碰巧发布了一条数学评论（例如：1<2），您不想删除整个评论。浏览器（仅测试了chrome）不将unicode作为html标记运行。如果将所有<替换为&lt；字符串中的每一个文件，unicode都将显示<为文本，而不运行任何html。我推荐方法2。jquery也能很好地工作$（'#element'）.text（）；

2019-12-14 21:28:33

从文本JavaScript中删除HTML

推荐文章

最新文章

标签