我有非常简单的
HTML文本(只有< b>标记),例如
Lorem Ipsum< b>只是虚拟< / b>印刷和< b>排版行业的文本< / b>
我想将文本分割成这样的数组:
[0] - Lorem Ipsum is
[1] - <b>simply dummy</b>
[2] - text of the printing and
[3] - <b>typesetting industry</b>
HTML标记内的文本必须与其他文本分开.它有什么简单的解决方案吗?
谢谢
最佳答案 您可以使用以下代码实现此目的
string value = @"Lorem Ipsum is <b>simply dummy</b> text of the printing and <b>typesetting industry</b>";
var parts = Regex.Split(value, @"(<b>[\s\S]+?<\/b>)").Where(l => l != string.Empty).ToArray();