C#의 LINQ 쿼리 소개

쿼리는 데이터 소스에서 데이터를 검색하는 식입니다. 서로 다른 데이터 원본에는 관계형 데이터베이스용 SQL 및 XML용 XQuery와 같은 다양한 네이티브 쿼리 언어가 있습니다. 개발자는 지원해야 하는 데이터 원본 또는 데이터 형식의 각 형식에 대한 새 쿼리 언어를 학습해야 합니다. LINQ는 데이터 원본 및 형식의 종류에 일관된 C# 언어 모델을 제공하여 이러한 상황을 간소화합니다. LINQ 쿼리에서는 항상 C# 개체를 사용합니다. 동일한 기본 코딩 패턴을 사용하여 LINQ 공급자를 사용할 수 있는 경우 XML 문서, SQL 데이터베이스, .NET 컬렉션 및 기타 형식의 데이터를 쿼리하고 변환합니다.

쿼리 작업의 세 부분

모든 LINQ 쿼리 작업은 다음과 같은 세 가지 고유한 작업으로 구성됩니다.

  1. 데이터 소스 가져오기.
  2. 쿼리 만들기.
  3. 쿼리를 실행합니다.

다음 예제에서는 쿼리 작업의 세 부분이 소스 코드로 표현되는 방식을 보여 줍니다. 예제에서는 편의상 정수 배열을 데이터 소스로 사용하지만 다른 데이터 소스에도 동일한 개념이 적용됩니다. 이 예제는 이 문서의 나머지 부분 전체에서 참조됩니다.

// The Three Parts of a LINQ Query:
// 1. Data source.
int[] numbers = [ 0, 1, 2, 3, 4, 5, 6 ];

// 2. Query creation.
// numQuery is an IEnumerable<int>
var numQuery =
    from num in numbers
    where (num % 2) == 0
    select num;

// 3. Query execution.
foreach (int num in numQuery)
{
    Console.Write("{0,1} ", num);
}

다음 그림에서는 전체 쿼리 작업을 보여 줍니다. LINQ에서 쿼리 실행은 쿼리 자체와 다릅니다. 즉, 쿼리 변수를 만들어 데이터를 검색하지 않습니다.

전체 LINQ 쿼리 작업의 다이어그램

데이터 소스

이전 예제의 데이터 원본은 제네릭 IEnumerable<T> 인터페이스를 지원하는 배열입니다. 즉, LINQ로 쿼리할 수 있다는 의미입니다. 쿼리가 foreach 문에서 실행되고, foreachIEnumerable 또는 IEnumerable<T>이 필요합니다. IEnumerable<T> 또는 제네릭 IQueryable<T> 같은 파생된 인터페이스를 지원하는 형식을 쿼리 가능 형식이라고 합니다.

쿼리 가능 형식은 LINQ 데이터 소스로 사용하기 위해 수정하거나 특별하게 처리할 필요가 없습니다. 원본 데이터가 쿼리 가능 형식으로 메모리에 아직 없는 경우 LINQ 공급자는 이를 나타내야 합니다. 예를 들어 LINQ to XML은 XML 문서를 쿼리 가능 XElement 형식으로 로드합니다.

// Create a data source from an XML document.
// using System.Xml.Linq;
XElement contacts = XElement.Load(@"c:\myContactList.xml");

EntityFramework를 사용하여 C# 클래스와 데이터베이스 스키마 간에 개체 관계형 매핑을 만듭니다. 개체에 대한 쿼리를 작성하고 런타임에 EntityFramework가 데이터베이스와의 통신을 처리합니다. 다음 예에서 Customers는 데이터베이스의 특정 테이블을 나타내며, IQueryable<T> 쿼리 결과 형식은 IEnumerable<T>에서 파생됩니다.

Northwnd db = new Northwnd(@"c:\northwnd.mdf");

// Query for customers in London.
IQueryable<Customer> custQuery =
    from cust in db.Customers
    where cust.City == "London"
    select cust;

특정 형식의 데이터 소스를 만드는 방법에 대한 자세한 내용은 다양한 LINQ 공급자에 대한 설명서를 참조하세요. 그러나 기본 규칙은 간단합니다. LINQ 데이터 원본은 제네릭 IEnumerable<T> 인터페이스를 지원하는 모든 개체이거나, 거기서 상속되는 인터페이스(일반적으로 IQueryable<T>)입니다.

참고 항목

제네릭이 아닌 IEnumerable 인터페이스를 지원하는 ArrayList 같은 형식은 LINQ 데이터 소스로도 사용됩니다. 자세한 내용은 LINQ를 사용하여 ArrayList를 쿼리하는 방법(C#)을 참조하세요.

쿼리

쿼리는 데이터 소스 또는 소스에서 검색할 정보를 지정합니다. 선택적으로 쿼리는 해당 정보가 반환되기 전에 정렬, 그룹화 및 형성되는 방법도 지정합니다. 쿼리는 쿼리 변수에 저장되고 쿼리 식으로 초기화됩니다. C# 쿼리 구문을 사용하여 쿼리를 작성합니다.

이전 예제의 쿼리는 정수 배열에서 모든 짝수를 반환합니다. 쿼리 식에는 from, where, select의 세 가지 절이 포함되어 있습니다. (SQL에 익숙한 경우 절의 순서가 SQL의 순서와 반대임을 알고 있을 것입니다.) from 절은 데이터 소스를 지정하고 where 절은 필터를 적용하며 select 절은 반환되는 요소의 형식을 지정합니다. 이 섹션에서는 모든 쿼리 절에 대해 자세히 논의합니다. 여기에서 중요한 점은 LINQ에서 쿼리 변수 자체는 아무 작업도 수행하지 않고 데이터를 반환하지 않는다는 것입니다. 나중에 쿼리가 실행될 때 결과를 생성하는 데 필요한 정보를 저장합니다. 쿼리가 생성되는 방법에 대한 자세한 내용은 표준 쿼리 연산자 개요(C#)를 참조하세요.

참고 항목

쿼리는 메서드 구문을 사용하여 표현할 수도 있습니다. 자세한 내용은 LINQ의 쿼리 구문 및 메서드 구문을 참조하세요.

실행 방식에 따른 표준 쿼리 연산자 분류

표준 쿼리 연산자 메서드의 LINQ to Objects 구현은 즉시 실행 또는 지연된 실행의 두 가지 기본 방식 중 하나로 실행됩니다. 지연된 실행을 사용하는 쿼리 연산자는 스트리밍비스트리밍의 두 가지 범주로 추가로 구분할 수 있습니다.

Immediate

즉시 실행은 데이터 소스를 읽고 작업이 한 번 수행됨을 의미합니다. 스칼라 결과를 반환하는 모든 표준 쿼리 연산자는 즉시 실행됩니다. 이러한 쿼리의 예로 Count, Max, AverageFirst가 있습니다. 이러한 메서드는 쿼리 자체가 결과를 반환하기 위해 foreach(을)를 사용해야 하므로 명시적 foreach 문 없이 실행됩니다. 이러한 쿼리는 IEnumerable 컬렉션이 아닌 단일 값을 반환합니다. Enumerable.ToList 또는 Enumerable.ToArray 메서드를 사용하면 모든 쿼리가 즉시 실행되도록 할 수 있습니다. 즉시 실행하면 쿼리 선언이 아닌 쿼리 결과를 다시 사용할 수 있습니다. 결과는 한 번 검색된 다음 나중에 사용할 수 있도록 저장됩니다. 다음 쿼리는 소스 배열에서 짝수의 개수를 반환합니다.

var evenNumQuery =
    from num in numbers
    where (num % 2) == 0
    select num;

int evenNumCount = evenNumQuery.Count();

모든 쿼리를 즉시 실행하고 그 결과를 캐시하기 위해 ToList 또는 ToArray 메서드를 호출할 수 있습니다.

List<int> numQuery2 =
    (from num in numbers
        where (num % 2) == 0
        select num).ToList();

// or like this:
// numQuery3 is still an int[]

var numQuery3 =
    (from num in numbers
        where (num % 2) == 0
        select num).ToArray();

또한 foreach 루프를 쿼리 식 바로 다음에 배치하여 강제로 실행할 수 있습니다. 그러나 ToList 또는 ToArray를 호출하여 단일 컬렉션 개체에서 모든 데이터를 캐시할 수도 있습니다.

연기됨

지연된 실행은 코드의 쿼리가 선언되는 지점에서 작업이 수행되지 않음을 의미합니다. 예를 들어 foreach 문을 사용하여 쿼리 변수가 열거될 경우에만 작업이 수행됩니다. 쿼리 실행 결과는 쿼리 정의 시점이 아닌 쿼리 실행 시점의 데이터 원본 콘텐츠에 따라 달라집니다. 쿼리 변수가 여러 번 열거될 경우 매번 결과가 다를 수 있습니다. 반환 형식이 IEnumerable<T> 또는 IOrderedEnumerable<TElement>인 표준 쿼리 연산자는 대부분 지연 방식으로 실행됩니다. 지연 실행은 쿼리 결과가 반복될 때마다 쿼리가 데이터 소스에서 업데이트된 데이터를 가져오므로 쿼리 재사용 기능을 제공합니다. 다음 코드는 지연된 실행의 예를 보여 줍니다.

foreach (int num in numQuery)
{
    Console.Write("{0,1} ", num);
}

foreach 문은 쿼리 결과가 검색되는 위치이기도 합니다. 예를 들어 이전 쿼리에서 반복 변수 num은 반환된 시퀀스에서 각 값을 한 번에 하나씩 저장합니다.

쿼리 변수 자체는 쿼리 결과를 보유하지 않으므로 반복적으로 실행하여 업데이트된 데이터를 검색할 수 있습니다. 예를 들어, 별도의 애플리케이션이 데이터베이스를 지속적으로 업데이트할 수 있습니다. 사용 중인 애플리케이션에서 최신 데이터를 검색하는 하나의 쿼리를 만들 수 있으며, 업데이트된 결과를 검색하기 위해 간격을 두고 실행할 수 있습니다.

지연된 실행을 사용하는 쿼리 연산자는 스트리밍 및 비스트리밍으로 추가로 분류할 수 있습니다.

스트리밍

스트리밍 운영자는 요소를 생성하기 전에 모든 원본 데이터를 읽을 필요가 없습니다. 실행 시 스트리밍 연산자는 소스 요소를 읽을 때 각 소스 요소에 대해 작업을 수행하고 해당하는 경우 요소를 생성합니다. 스트리밍 연산자는 결과 요소가 생성될 때까지 소스 요소를 계속 읽습니다. 즉, 두 개 이상의 소스 요소를 읽어 하나의 결과 요소를 생성할 수 있습니다.

비스트리밍

비스트리밍 연산자는 결과 요소를 생성하기 전에 모든 원본 데이터를 읽어야 합니다. 정렬 또는 그룹화 등의 작업은 이 범주로 분류됩니다. 실행 시 비스트리밍 쿼리 연산자는 모든 원본 데이터를 읽고, 데이터 구조에 넣고, 작업을 수행하고, 결과 요소를 생성합니다.

분류 표

다음 표에서는 실행 방법에 따라 각 표준 쿼리 연산자 메서드를 분류합니다.

참고 항목

한 연산자가 두 개의 열에 표시되어 있으면 두 개의 입력 시퀀스가 작업에 포함되고 각 시퀀스는 다르게 계산됩니다. 이러한 경우에 지연된 스트리밍 방식으로 계산되는 것은 항상 매개 변수 목록의 첫 번째 시퀀스입니다.

표준 쿼리 연산자 반환 형식 즉시 실행 지연된 스트리밍 실행 지연된 비스트리밍 실행
Aggregate TSource X
All Boolean X
Any Boolean X
AsEnumerable IEnumerable<T> X
Average 단일 숫자 값 X
Cast IEnumerable<T> X
Concat IEnumerable<T> X
Contains Boolean X
Count Int32 X
DefaultIfEmpty IEnumerable<T> X
Distinct IEnumerable<T> X
ElementAt TSource X
ElementAtOrDefault TSource? X
Empty IEnumerable<T> X
Except IEnumerable<T> X X
First TSource X
FirstOrDefault TSource? X
GroupBy IEnumerable<T> X
GroupJoin IEnumerable<T> X X
Intersect IEnumerable<T> X X
Join IEnumerable<T> X X
Last TSource X
LastOrDefault TSource? X
LongCount Int64 X
Max 단일 숫자 값, TSource 또는 TResult? X
Min 단일 숫자 값, TSource 또는 TResult? X
OfType IEnumerable<T> X
OrderBy IOrderedEnumerable<TElement> X
OrderByDescending IOrderedEnumerable<TElement> X
Range IEnumerable<T> X
Repeat IEnumerable<T> X
Reverse IEnumerable<T> X
Select IEnumerable<T> X
SelectMany IEnumerable<T> X
SequenceEqual Boolean X
Single TSource X
SingleOrDefault TSource? X
Skip IEnumerable<T> X
SkipWhile IEnumerable<T> X
Sum 단일 숫자 값 X
Take IEnumerable<T> X
TakeWhile IEnumerable<T> X
ThenBy IOrderedEnumerable<TElement> X
ThenByDescending IOrderedEnumerable<TElement> X
ToArray TSource[] 배열 X
ToDictionary Dictionary<TKey,TValue> X
ToList IList<T> X
ToLookup ILookup<TKey,TElement> X
Union IEnumerable<T> X
Where IEnumerable<T> X

LINQ to Objects

"LINQ to Objects"는 IEnumerable 또는 IEnumerable<T> 컬렉션과 함께 LINQ 쿼리를 직접 사용하는 것을 의미합니다. LINQ를 사용하면 List<T>, Array, Dictionary<TKey,TValue> 등의 모든 열거 가능 컬렉션을 쿼리할 수 있습니다. 컬렉션은 사용자 정의일 수도 있고 .NET API에서 반환된 형식일 수도 있습니다. 그러나 LINQ 방식에서는 검색할 항목을 설명하는 선언적 코드를 작성합니다. LINQ to Objects는 LINQ를 사용한 프로그래밍에 대한 유용한 소개를 제공합니다.

LINQ 쿼리는 기존 foreach 루프에 비해 세 가지 주요 이점을 제공합니다.

  • 보다 간결하며 쉽게 읽을 수 있습니다(특히 여러 조건을 필터링하는 경우).
  • 최소한의 애플리케이션 코드로도 강력한 필터링, 순서 지정 및 그룹화 기능을 제공합니다.
  • 거의 또는 전혀 수정하지 않고도 다른 데이터 소스에 이식할 수 있습니다.

데이터에 대해 수행하려는 작업이 복잡할수록 기존 반복 기술 대신 LINQ를 사용하여 더 많은 이점을 얻을 수 있습니다.

쿼리 결과를 메모리에 저장

쿼리는 기본적으로 데이터를 검색하고 구성하는 방법에 대한 명령 집합입니다. 쿼리는 결과의 각 후속 항목이 요청될 때 지연 실행됩니다. foreach를 사용하여 결과를 반복하는 경우 항목이 액세스될 때 반환됩니다. 쿼리를 평가한 후 foreach 루프를 실행하지 않고 결과를 저장하려면 쿼리 변수에 대해 다음 메서드 중 하나를 호출합니다.

다음 예와 같이 쿼리 결과를 저장할 때 반환된 컬렉션 개체를 새 변수에 할당해야 합니다.

List<int> numbers = [1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20];

IEnumerable<int> queryFactorsOfFour =
    from num in numbers
    where num % 4 == 0
    select num;

// Store the results in a new variable
// without executing a foreach loop.
var factorsofFourList = queryFactorsOfFour.ToList();

// Read and write from the newly created list to demonstrate that it holds data.
Console.WriteLine(factorsofFourList[2]);
factorsofFourList[2] = 0;
Console.WriteLine(factorsofFourList[2]);

참고 항목