如何使用HTML敏捷包?
我的XHTML文档不完全有效。所以我才想用它。如何在我的项目中使用它?我的项目是用c#编写的。
如何使用HTML敏捷包?
我的XHTML文档不完全有效。所以我才想用它。如何在我的项目中使用它?我的项目是用c#编写的。
当前回答
HtmlAgilityPack使用XPath语法,尽管许多人认为它的文档记录很差,但在XPath文档https://www.w3schools.com/xml/xpath_syntax.asp的帮助下,我使用它没有任何困难
解析
<h2>
<a href="">Jack</a>
</h2>
<ul>
<li class="tel">
<a href="">81 75 53 60</a>
</li>
</ul>
<h2>
<a href="">Roy</a>
</h2>
<ul>
<li class="tel">
<a href="">44 52 16 87</a>
</li>
</ul>
我是这样做的:
string url = "http://website.com";
var Webget = new HtmlWeb();
var doc = Webget.Load(url);
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//h2//a"))
{
names.Add(node.ChildNodes[0].InnerHtml);
}
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//li[@class='tel']//a"))
{
phones.Add(node.ChildNodes[0].InnerHtml);
}
其他回答
public string HtmlAgi(string url, string key)
{
var Webget = new HtmlWeb();
var doc = Webget.Load(url);
HtmlNode ourNode = doc.DocumentNode.SelectSingleNode(string.Format("//meta[@name='{0}']", key));
if (ourNode != null)
{
return ourNode.GetAttributeValue("content", "");
}
else
{
return "not fount";
}
}
我不知道这对您是否有任何帮助,但我已经写了几篇介绍基础知识的文章。
HtmlAgilityPack文章系列 htmllagilitypack库简介 使用HtmlAgilityPack轻松从html片段中提取链接
下一篇文章已经完成了95%,我只需要对我所编写的最后几部分代码进行解释。如果你感兴趣,那么当我发布它时,我会尽量记得在这里发布。
试试这个
string htmlBody = ParseHmlBody(dtViewDetails.Rows[0]["Body"].ToString());
private string ParseHmlBody(string html)
{
string body = string.Empty;
try
{
var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(html);
var htmlBody = htmlDoc.DocumentNode.SelectSingleNode("//body");
body = htmlBody.OuterHtml;
}
catch (Exception ex)
{
dalPendingOrders.LogMessage("Error in ParseHmlBody" + ex.Message);
}
return body;
}
HtmlAgilityPack使用XPath语法,尽管许多人认为它的文档记录很差,但在XPath文档https://www.w3schools.com/xml/xpath_syntax.asp的帮助下,我使用它没有任何困难
解析
<h2>
<a href="">Jack</a>
</h2>
<ul>
<li class="tel">
<a href="">81 75 53 60</a>
</li>
</ul>
<h2>
<a href="">Roy</a>
</h2>
<ul>
<li class="tel">
<a href="">44 52 16 87</a>
</li>
</ul>
我是这样做的:
string url = "http://website.com";
var Webget = new HtmlWeb();
var doc = Webget.Load(url);
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//h2//a"))
{
names.Add(node.ChildNodes[0].InnerHtml);
}
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//li[@class='tel']//a"))
{
phones.Add(node.ChildNodes[0].InnerHtml);
}
入门- HTML敏捷包
// From File
var doc = new HtmlDocument();
doc.Load(filePath);
// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);
// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);