Cara: Mengkueri Kalimat yang Berisi Set Kata Tertentu (LINQ) (Visual Basic)

Contoh ini menunjukkan cara menemukan kalimat dalam file teks yang berisi kecocokan untuk setiap set kata tertentu. Meskipun array istilah pencarian dikodekan secara permanen dalam contoh ini, array tersebut juga dapat diisi secara dinamis pada durasi. Dalam contoh ini, kueri mengembalikan kalimat yang berisi kata "Secara Historis," "data," dan "terintegrasi."


Class FindSentences

    Shared Sub Main()
        Dim text As String = "Historically, the world of data and the world of objects " &
        "have not been well integrated. Programmers work in C# or Visual Basic " &
        "and also in SQL or XQuery. On the one side are concepts such as classes, " &
        "objects, fields, inheritance, and .NET Framework APIs. On the other side " &
        "are tables, columns, rows, nodes, and separate languages for dealing with " &
        "them. Data types often require translation between the two worlds; there are " &
        "different standard functions. Because the object world has no notion of query, a " &
        "query can only be represented as a string without compile-time type checking or " &
        "IntelliSense support in the IDE. Transferring data from SQL tables or XML trees to " &
        "objects in memory is often tedious and error-prone."

        ' Split the text block into an array of sentences.
        Dim sentences As String() = text.Split(New Char() {".", "?", "!"})

        ' Define the search terms. This list could also be dynamically populated at run time
        Dim wordsToMatch As String() = {"Historically", "data", "integrated"}

        ' Find sentences that contain all the terms in the wordsToMatch array
        ' Note that the number of terms to match is not specified at compile time
        Dim sentenceQuery = From sentence In sentences
                            Let w = sentence.Split(New Char() {" ", ",", ".", ";", ":"},
                            Where w.Distinct().Intersect(wordsToMatch).Count = wordsToMatch.Count()
                            Select sentence

        ' Execute the query
        For Each str As String In sentenceQuery

        ' Keep console window open in debug mode.
        Console.WriteLine("Press any key to exit.")
    End Sub

End Class
' Output:
' Historically, the world of data and the world of objects have not been well integrated

Kueri bekerja dengan terlebih dahulu membagi teks ke dalam kalimat-kalimat, lalu membagi kalimat ke dalam array string yang berisi setiap kata. Untuk masing-masing array ini, metode Distinct menghapus semua kata duplikat, lalu kueri akan menjalankan operasi Intersect pada array kata dan array wordsToMatch. Jika jumlah titik potong sama dengan jumlah array wordsToMatch, semua kata ditemukan dan kalimat asli dikembalikan.

Dalam panggilan ke Split, tanda baca digunakan sebagai pemisah untuk menghapusnya dari string. Jika Anda tidak melakukan ini, misalnya Anda mungkin memiliki string "Secara Historis," yang tidak akan cocok dengan "Secara Historis" dalam array wordsToMatch. Anda mungkin harus menggunakan pemisah tambahan, tergantung dari jenis tanda baca yang ditemukan dalam teks sumber.

Mengkompilasi kode

Buat proyek aplikasi konsol Visual Basic, dengan Imports pernyataan untuk namespace Layanan System.Linq.

Lihat juga