共用方式為


HOW TO:辨識 Visual Basic HTML 字串中的文字

這個範例會使用簡單的規則運算式 (Regular Expression) 移除 HTML 文件的標記。

範例

HTML 標記會與規則運算式 \<[^\>]+\> 相符,這表示:

  1. 字元 "<",之後接著

  2. 一個或多個字元集合,不包括 ">" 字元,之後接著

  3. 字元 ">"。

這個範例會使用共用的 Regex.Replace 方法,以使用空字串取代標記規則運算式的所有符合項。

    ''' <summary>Removes the tags from an HTML document.</summary>
    ''' <param name="htmlText">HTML text to parse.</param>
    ''' <returns>The text of an HTML document without tags.</returns>
    ''' <remarks></remarks>
    Function GetTextFromHtml(ByVal htmlText As String) As String
        Dim output As String = Regex.Replace(htmlText, "\<[^\>]+\>", "")
        Return output
    End Function

這個範例要求您必須使用 Imports 陳述式,匯入 System.Text.RegularExpressions 命名空間。 如需詳細資訊,請參閱 Imports 陳述式 (.NET 命名空間和型別)

請參閱

工作

HOW TO:在 Visual Basic 中識別 HTML 字串內的超連結

HOW TO:從字串中刪除無效的字元

其他資源

在 Visual Basic 中剖析字串