방법: Visual Basic에서 HTML 문자열의 텍스트 식별
이 예제에서는 간단한 정규식을 사용하여 HTML 문서에서 태그를 제거하는 방법을 보여 줍니다.
예제
HTML 태그 대신 \<[^\>]+\>와 같은 정규식을 사용할 수 있습니다. 즉, 다음과 같습니다.
문자 "<"를 입력합니다.
문자 ">"를 제외한 하나 이상의 문자 집합을 입력합니다.
문자 ">"를 입력합니다.
이 예제에서는 공유 Regex.Replace 메서드를 사용하여 태그 정규식과 일치하는 모든 문자를 빈 문자열로 바꿉니다.
''' <summary>Removes the tags from an HTML document.</summary>
''' <param name="htmlText">HTML text to parse.</param>
''' <returns>The text of an HTML document without tags.</returns>
''' <remarks></remarks>
Function GetTextFromHtml(ByVal htmlText As String) As String
Dim output As String = Regex.Replace(htmlText, "\<[^\>]+\>", "")
Return output
End Function
다음 예제에서는 Imports 문을 사용하여 System.Text.RegularExpressions 네임스페이스를 가져와야 합니다. 자세한 내용은 Imports 문(.NET 네임스페이스 및 형식)을 참조하십시오.
참고 항목
작업
방법: Visual Basic에서 HTML 문자열의 하이퍼링크 식별