js 正则匹配（去掉html标签）

2024年1月20日 97次阅读来源: taoyh

1，得到网页上的链接地址：

string matchString = @"<a[^>]+href=\s*(?:'(?<href>^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";

2，得到网页的标题：

string matchString = @"<title>(?<title>.*)</title>";

3，去掉网页中的所有的html标记：

string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档

4, string matchString = @"<title>([\S\s\t]*?)</title>";
5, js去掉所有html标记的函数：

function delHtmlTag(str)
{
      return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

6. 统计字数

t = $('.remarktext').html().replace(/<[^>]+>/g,"").length;

    原文作者：taoyh
    原文地址: https://segmentfault.com/a/1190000000405922
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。