c# – 使用xml.Load打开HTML文档

我想打开一个
HTML文档(作为从StreamReader中检索的字符串,来自网络),

通过这种方式创建
XMLDocument:

XmlDocument doc = new XmlDocument

doc.Load(string containing the retrieved document).

但由于HTML doc包含以下内容:

 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" > 

它告诉我文档无效……有什么方法可以解决这个问题吗?

最佳答案 普通的html,即使它是有效的html,也不是有效的xml.

有一个名为HtmlAgilityPack的库,它是一个流行的第三方开源库,您可以使用它来解决此问题:

> http://www.google.co.uk/search?q=htmlagilitypack
> How to use HTML Agility pack

点赞