다음을 통해 공유


방법: Visual Basic에서 HTML 문자열의 텍스트 식별

이 예제에서는 간단한 정규식을 사용하여 HTML 문서에서 태그를 제거하는 방법을 보여 줍니다.

예제

HTML 태그 대신 \<[^\>]+\>와 같은 정규식을 사용할 수 있습니다. 즉, 다음과 같습니다.

  1. 문자 "<"를 입력합니다.

  2. 문자 ">"를 제외한 하나 이상의 문자 집합을 입력합니다.

  3. 문자 ">"를 입력합니다.

이 예제에서는 공유 Regex.Replace 메서드를 사용하여 태그 정규식과 일치하는 모든 문자를 빈 문자열로 바꿉니다.

    ''' <summary>Removes the tags from an HTML document.</summary>
    ''' <param name="htmlText">HTML text to parse.</param>
    ''' <returns>The text of an HTML document without tags.</returns>
    ''' <remarks></remarks>
    Function GetTextFromHtml(ByVal htmlText As String) As String
        Dim output As String = Regex.Replace(htmlText, "\<[^\>]+\>", "")
        Return output
    End Function

다음 예제에서는 Imports 문을 사용하여 System.Text.RegularExpressions 네임스페이스를 가져와야 합니다. 자세한 내용은 Imports 문(.NET 네임스페이스 및 형식)을 참조하십시오.

참고 항목

작업

방법: Visual Basic에서 HTML 문자열의 하이퍼링크 식별

방법: 문자열에서 유효하지 않은 문자 제거

기타 리소스

Visual Basic의 문자열 구문 분석