如何获得标签在html页面,如果我知道什么文本标签包含。 例如:

<a ...>SearchingText</a>

当前回答

我想你需要说得更具体一点,我们才能帮到你。

你是怎么发现的?Javascript ?PHP吗?Perl吗? 您可以将ID属性应用于标记吗?

如果文本是唯一的(或者实际上不是唯一的,但必须通过数组运行),则可以运行正则表达式来找到它。使用PHP的preg_match()可以解决这个问题。

如果你正在使用Javascript并且可以插入ID属性,那么你可以使用getElementById(' ID ')。然后可以通过DOM: https://developer.mozilla.org/en/DOM/element.1访问返回元素的属性。

其他回答

你必须徒手穿越。

var aTags = document.getElementsByTagName("a");
var searchText = "SearchingText";
var found;

for (var i = 0; i < aTags.length; i++) {
  if (aTags[i].textContent == searchText) {
    found = aTags[i];
    break;
  }
}

// Use `found`.

我发现,与其他答案相比,新语法的使用略短。所以我的建议是:

const callback = element => element.innerHTML == 'My research'

const elements = Array.from(document.getElementsByTagName('a'))
// [a, a, a, ...]

const result = elements.filter(callback)

console.log(result)
// [a]

JSfiddle.net

使用目前最现代的语法,它可以像这样非常干净地完成:

for (const a of document.querySelectorAll("a")) {
  if (a.textContent.includes("your search term")) {
    console.log(a.textContent)
  }
}

或者使用单独的过滤器:

[...document.querySelectorAll("a")]
   .filter(a => a.textContent.includes("your search term"))
   .forEach(a => console.log(a.textContent))

当然,遗留浏览器不能处理这个,但是如果需要遗留支持,可以使用转译器。

你可以这样做,不确定这是否被推荐,但对我来说很有效。

[... document.querySelectorAll('a')].filter(el => el.textContent.includes('sometext'));

简单地将你的子字符串传递到下面一行:

外的HTML

document.documentElement.outerHTML.includes('substring')

内心的HTML

document.documentElement.innerHTML.includes('substring')

你可以使用这些来搜索整个文档并检索包含搜索词的标签:

function get_elements_by_inner(word) {
    res = []
    elems = [...document.getElementsByTagName('a')];
    elems.forEach((elem) => { 
        if(elem.outerHTML.includes(word)) {
            res.push(elem)
        }
    })
    return(res)
}

用法:

用户“T3rm1”在本页上被提到了多少次?

get_elements_by_inner("T3rm1").length

1

jQuery被提到了多少次?

get_elements_by_inner("jQuery").length

3

获取所有包含“Cybernetic”的元素:

get_elements_by_inner("Cybernetic")