Teoria algorytmu wyszukiwania Grovera

2025-01-16

W tym artykule znajdziesz szczegółowe teoretyczne wyjaśnienie zasad matematycznych, które sprawiają, że algorytm Grovera działa.

Aby zapoznać się z praktyczną implementacją algorytmu Grovera w celu rozwiązywania problemów matematycznych, zobacz Implementowanie algorytmu wyszukiwania Grovera.

Stwierdzenie problemu

Algorytm Grovera przyspiesza rozwiązanie wyszukiwania danych bez struktury (lub problem z wyszukiwaniem), uruchamiając wyszukiwanie w mniejszej liczbie kroków niż jakikolwiek algorytm klasyczny. Każde zadanie wyszukiwania można wyrazić za pomocą funkcji $abstrakcyjnej f(x),$ która akceptuje elementy $wyszukiwania x$. Jeśli element $x$ jest rozwiązaniem zadania wyszukiwania, $f(x)=1$. Jeśli element $x$ nie jest rozwiązaniem, $f(x)=0$. Problem z wyszukiwaniem polega na znalezieniu dowolnego elementu $x_0$ tak, aby $f(x_0)=1$.

Każdy problem, który pozwala sprawdzić, czy dana wartość $x$ jest prawidłowym rozwiązaniem (problem "tak lub nie"), można sformułować w kategoriach problemu poszukiwawczego. Poniżej przedstawiono kilka przykładów:

Problem z satyfikością logiczną: Biorąc pod uwagę zestaw wartości logicznych, czy zestaw spełnia daną formułę logiczną?
Problem z podróżą sprzedawcy: Jaka jest najkrótsza możliwa pętla, która łączy wszystkie miasta?
Problem z wyszukiwaniem bazy danych: Czy tabela bazy danych zawiera rekord $x$?
Problem z faktoryzacją całkowitą: czy liczba $N$ jest podzielna przez liczbę $x$?

Zadanie, które ma na celu algorytm Grovera, można wyrazić w następujący sposób: biorąc pod uwagę klasyczną funkcję $f(x):\{0,1\}^n \rightarrow\{0,1\}$, gdzie $n$ jest rozmiarem bitowym przestrzeni wyszukiwania, znajdź dane wejściowe $x_0$ , dla których $f(x_0)=1$. Złożoność algorytmu jest mierzona przez liczbę zastosowań funkcji $f(x)$. Klasycznie, w najgorszym scenariuszu, $f(x)$ musi zostać obliczona łącznie $N-1$ razy, gdzie $N==2^n$, próbując wszystkie możliwe rozwiązania. Po $N-1$ elementach musi być ostatni element. Algorytm kwantowy Grovera może rozwiązać ten problem znacznie szybciej, zapewniając szybkość kwadratową. Tutaj "kwadratowy" oznacza, że wymagane byłyby tylko około $\sqrt{N}$ ocen, w porównaniu do $N$.

Konspekt algorytmu

Załóżmy, że istnieją $n=2^n$ kwalifikujących się elementów do zadania wyszukiwania i są one indeksowane przez przypisanie każdej jednostki całkowitej z zakresu od $0$ do $N-1$. Ponadto załóżmy, że istnieją $różne prawidłowe dane wejściowe języka M$ , co oznacza, że istnieją $dane wejściowe języka M$ , dla których $f(x)=1$. Następnie kroki algorytmu są następujące:

Zacznij od rejestru kubitów $n$, zainicjowanych w stanie $\ket{0}$.
Przygotuj rejestr do jednolitej superpozycji, stosując $H do każdego kubitu rejestru: $zarejestruj$$|\text{N}\rangle=\frac{1}{\sqrt{}}_\sumx{0=^}N-1{}| x\rangle$$
Zastosuj następujące operacje do rejestru $N_{\text{optymalnej}}$ liczbę razy:
1. Wyrocznia fazowa $O_f$, która stosuje przesunięcie fazy warunkowej o $-1$ dla elementów rozwiązania.
2. Zastosuj $H$ do każdego kubitu w rejestrze.
3. Przesunięcie fazy warunkowej $-1$ dla każdego stanu podstawy obliczeniowej z wyjątkiem $\ket{0}$. Może to być reprezentowane przez operację $jednostkową -O_0$, ponieważ $O_0$ reprezentuje przesunięcie fazy warunkowej tylko na $\ket{0}$ .
4. Zastosuj $H$ do każdego kubitu w rejestrze.
Zmierz rejestr, aby uzyskać indeks elementu, który jest rozwiązaniem z bardzo wysokim prawdopodobieństwem.
Sprawdź, czy jest to prawidłowe rozwiązanie. Jeśli nie, uruchom ponownie.

$N_{\text{optymalne}}=\left\lfloor \frac{\pi}{{4}\sqrt{\frac{N}{M}}-\frac{{1}{{2}\right\rpodłoga$ jest optymalną liczbą iteracji, która maksymalizuje prawdopodobieństwo uzyskania prawidłowego elementu poprzez pomiar rejestru.

Uwaga

Wspólne stosowanie kroków 3.b, 3.c i 3.d jest zwykle znane jako operator dyfuzji Grovera.

Ogólna operacja jednostkowa zastosowana do rejestru to:

$$(-H^{\otimes n}O_0H^{\otimes n}O_f)^{N_{\text{optymalny}}}H^{\otimes n}$$

Śledzenie stanu rejestru krok po kroku

Aby zilustrować ten proces, postępujmy zgodnie z matematycznymi przekształceniami stanu rejestru dla prostego przypadku, w którym istnieją tylko dwa kubity, a prawidłowym elementem jest $\ket{01}.$

Rejestr rozpoczyna się w stanie:

$$\ket{\text{zarejestrować}}=\ket{{00}$$
Po zastosowaniu $H$ do każdego kubitu stan rejestru przekształca się na:

$$\ket{\text{rejestr}}=\frac{{1}{\sqrt{4}}\sum_{i \in \lbrace 0,1 \rklamra}^2\ket{i}=\frac12(\ket{00}+\ket{01}+\ket{{10}+\ket{11})$$
Następnie wyrocznia fazowa jest stosowana, aby uzyskać:

$$\ket{\text{rejestr}}=\frac12(\ket{{00}-\ket{{01}+\ket{{10}+\ket{{11})$$
Następnie $H$ działa na każdym kubicie ponownie, aby dać:

$$\ket{\text{ }} = \frac12(\ket{{00}+\ket{{01}-\ket{{10}+\ket{{11})$$
Teraz przesunięcie fazy warunkowej jest stosowane w każdym stanie z wyjątkiem $\ket{00}$:

$$\ket{\text{ }} = \frac12(\ket{{00}—\ket{{01}+\ket{{10}—\ket{{11})$$
Na koniec pierwsza iteracja Grovera kończy się zastosowaniem $H$ ponownie, aby uzyskać:

$$\ket{\text{zarejestrować}}=\ket{{01}$$

Wykonując powyższe kroki, prawidłowy element znajduje się w pojedynczej iteracji. Jak zobaczysz później, jest to spowodowane tym, że dla N=4 i pojedynczego prawidłowego elementu optymalna liczba powtórzeń jest $N_{\text{optymalna}}=1$.

Wyjaśnienie geometryczne

Aby zobaczyć, dlaczego algorytm Grovera działa, przeanalizujmy algorytm z geometrycznej perspektywy. Przyjmując, że istnieje $M$ prawidłowych rozwiązań, superpozycja wszystkich stanów kwantowych, które nie są rozwiązaniem problemu wyszukiwania:

$$\ket{\text{bad}}=\frac{{1}{\sqrt{N-M}}\sum_{x:f(x)=0}\ket{x}$$

Superpozycja wszystkich stanów, które są rozwiązaniem problemu wyszukiwania:

$$\ket{\text{dobrze}}=\frac{{1}{\sqrt{M}}\sum_{x:f(x)=1}\ket{x}$$

Ponieważ zbiory dobre i złe wykluczają się wzajemnie, ponieważ element nie może być jednocześnie prawidłowy i nieprawidłowy, stany są ortogonalne. Oba stany tworzą ortogonalną podstawę płaszczyzny w przestrzeni wektorowej. Można użyć tej płaszczyzny do wizualizacji algorytmu.

Wykres płaszczyzny w sferze Blocha przewidywany przez ortogonalne dobre i złe wektory.

Załóżmy, że $\ket{\psi}$ jest to dowolny stan, który znajduje się w płaszczyźnie rozpiętej przez $\ket{\text{dobre}}$ i $\ket{\text{złe}}$. Każdy stan leżący w tej płaszczyźnie może być wyrażony jako:

$$\ket{\psi} = \alpha \ket{\text{dobre}} + \beta\ket{\text{złe}}$$

gdzie $\alpha$ i $\beta$ są liczbami rzeczywistymi. Teraz przedstawimy operator odbicia $R_{\ket{\psi}}$, gdzie $\ket{\psi}$ jest dowolnym stanem kubitu leżącym w płaszczyźnie. Operator jest zdefiniowany jako:

$$ {\ket{\psi}}=R_2\ket{\psi}\bra{\psi}-\mathcal{I}$$

Nazywa się operatorem odbicia od $\ket{\psi}$, ponieważ można go geometrycznie interpretować jako odbicie względem kierunku $\ket{\psi}$. Aby to zobaczyć, weź ortogonalną bazę płaszczyzny utworzonej przez $\ket{\psi}$ i jej ortogonalne dopełnienie $\ket{\psi^{\perp}}$. Każdy stan $\ket{\xi}$ płaszczyzny można rozkładać w taki sposób:

$$\ket{\xi}=\mu \ket{\psi} + \nu {\ket{\psi^{\perp}}}$$

Jeśli zastosuje się operator $R_{\ket{\psi}}$ do $\ket{\xi}$:

$$ {\ket{\psi}}\ket{R_\xi}=\mu \ket{\psi} - \nu {\ket{\psi^{\perp}}}$$

Operator $R_{\ket{\psi}}$ odwraca składnik ortogonalny do $\ket{\psi}$ , ale pozostawia składnik $\ket{\psi}$ bez zmian. $W związku z tym R_{\ket{\psi}}$ jest refleksją na temat $\ket{\psi}$.

Wykres operatora odbicia względem stanu kwantowego wizualizowany na płaszczyźnie.

Algorytm Grovera, po pierwszym zastosowaniu H$ do każdego kubitu$, zaczyna się od jednolitej superpozycji wszystkich stanów. Można to napisać jako:

$$\ket{\text{wszystkie}}=\sqrt{\frac{M}{N}}\ket{\text{dobre + }}N-M\sqrt{\frac{N}{złe}}\ket{\text{}}$$

Wykres stanu początkowego jako superpozycja dobrych i złych stanów w płaszczyźnie.

A tym samym państwo mieszka w samolocie. Należy pamiętać, że prawdopodobieństwo uzyskania poprawnego wyniku podczas pomiaru z równej superpozycji jest po prostu $|\bra{\text{dobre}}\ket{\text{wszystkie}}|^2=M/N$, co można oczekiwać od losowego zgadnięcia.

Wyrocznia $O_f$ dodaje fazę ujemną do dowolnego rozwiązania problemu wyszukiwania. W związku z tym można to napisać jako odbicie względem osi negatywnej:

$$O_f = R_{\ket{\text{złe}}}= 2\ket{\text{złe}}\bra{\text{złe}} - \mathbb{I}$$

Analogicznie, przesunięcie $fazy warunkowej O_0$ jest po prostu odwróconym odbiciem stanu $\ket{0}$:

$$O_{0}= R_{\ket{0}}= -2\ket{{0}\bra{{0} I \mathbb{I}$$

Znając ten fakt, łatwo jest sprawdzić, czy operacja dyfuzji Grovera $-H^{\otimes n} O_{0} H^{\otimes n}$ jest również odbiciem stanu $\ket{wszystkich}$. Po prostu wykonaj:

$$-H^{\otimes n} O_{{0} H^{\otimes n}=2H^{\otimes n}\ket{0}\bra{{0}H^{\otimes n} -H^{\otimes n}\mathbb{I}H^{\otimes n}= 2\ket{\text{all}}\bra{\text{all}}\mathbb{I}= R_{\ket{\text{all}}}$$

Wykazano, że każda iteracja algorytmu Grovera jest kompozycją dwóch odbić $R_{\ket{\text{bad}}}$ i $R_{\ket{\text{all}}}$.

Wykres iteracji Grovera wizualizowany jako sekwencja dwóch odbicia w płaszczyźnie.

Łączny efekt każdej iteracji Grovera to obrót kąta $2\theta$ przeciwnie do ruchu wskazówek zegara. Na szczęście kąt $\theta$ jest łatwy do znalezienia. Ponieważ $\theta$ jest tylko kątem między $\ket{\text{all}}$ i $\ket{\text{bad}}$, można użyć produktu skalarnego, aby znaleźć kąt. Wiadomo, że $\cos{\theta}=\braket{\text{wszystkie}|\text{złe}}$, więc należy obliczyć $\braket{\text{wszystkie}|\text{złe}}$. Z dekompozycji wszystkiego pod względem złego i dobrego następuje:

$$\theta = \arccos({\leftwszystkie\braket{\text{złe}|\text{)}}\right \arccos}={\left(\sqrt{\frac{N-M}{N}}\right)}$$

Kąt między stanem rejestru a $\ket{\text{dobrym}}$ stanem zmniejsza się wraz z każdą iterację, co powoduje wyższe prawdopodobieństwo pomiaru prawidłowego wyniku. Aby obliczyć to prawdopodobieństwo, wystarczy obliczyć $|\braket{\text{good}|\text{register}}|^2$. Kąt między $\ket{\text{dobrym}}$ a $\ket{\text{rejestrem}}$ jest oznaczony jako $\gamma (k)$, gdzie $k$ jest liczbą iteracji:

$$\gamma = \frac{\pi}{2}-\theta -2k\theta =\frac{\pi}{{2} -(2k + 1) \theta $$

W związku z tym prawdopodobieństwo sukcesu jest następujące:

$$P(\text{success}) = \cos^2(\gamma(k)) = \sin^2\left[(2k +1)\arccos \left( \sqrt{\frac{N-M}{N}}\right)\right]$$

Optymalna liczba iteracji

Ponieważ prawdopodobieństwo sukcesu można napisać jako funkcję liczby iteracji, optymalna liczba iteracji $N_{\text{optymalna}}$ można znaleźć, obliczając najmniejszą dodatnią liczbę całkowitą, która (w przybliżeniu) maksymalizuje funkcję prawdopodobieństwa sukcesu.

Sinusoidalny wykres prawdopodobieństwa sukcesu jako funkcja iteracji Grovera. Optymalna liczba iteracji zbliża się do pierwszego szczytu.

Wiadomo, że $\sin^2{x}$ osiąga pierwszą maksymalną wartość dla $x=\frac{\pi}{2}$, więc:

$$\frac{\pi}{{2}=(2k_{\text{optymalne}} +1)\arccos \left( \sqrt{\frac{N-M}{N}}\right)$$

Daje to:

$$ {\text{k_optymalny}}=\frac{\pi}{4\arccos\left(\sqrt{1-M/N}\right)}-1/2 =\frac{\pi}{{4}\sqrt{\frac{N}{}}--\frac{1}{2}O\left(\sqrt\frac{M}{N)}\right$$

Gdzie w ostatnim kroku $\arccos \sqrt{1-x}=\sqrt{x} + O(x^{3/2})$.

W związku z tym można wybrać $N_{\text{optymalne}}=\left\lfloor \frac{\pi}{{4}\sqrt{\frac{N}{M}}-\frac{{1}{{2}\right\rfloor$.

Analiza złożoności

Z poprzedniej analizy wynika, że zapytania $O\left(\sqrt{\frac{N}{M}}\right)$ wyroczni $O_f$ są potrzebne do znalezienia prawidłowego elementu. Jednak czy algorytm można skutecznie zaimplementować pod względem złożoności czasu? $ $ O_0 opiera się na przetwarzaniu operacji logicznych na $n$ bitach i jest znany jako możliwy do zaimplementowania przy użyciu $bram O(n).$ Istnieją również dwie warstwy bram Hadamard $n$. Oba te składniki wymagają zatem tylko $O(n)$ bram na każdą iterację. Ponieważ $N=2^n$, następuje, że $O(n)=O(log(N))$. W związku z tym, jeśli potrzebne są O\left(\sqrt{\frac{N}{M}}\right)$ iteracje i $O(log(N))$ bramy na iterację, całkowita złożoność czasowa (bez uwzględniania implementacji wyroczni) to $O\left(\sqrt{\frac{N}{M}}log(N)\right)$.

Ogólna złożoność algorytmu zależy ostatecznie od złożoności implementacji wyroczni $O_f$. Jeśli ocena funkcji jest znacznie bardziej skomplikowana na komputerze kwantowym niż w klasycznym, ogólny czas wykonywania algorytmu będzie dłuższy w przypadku kwantowym, mimo że technicznie używa mniejszej liczby zapytań.

Bibliografia

Jeśli chcesz kontynuować naukę o algorytmie Grovera, możesz sprawdzić dowolne z następujących źródeł:

Oryginalny artykuł Lov K. Grovera
Sekcja algorytmów wyszukiwania kwantowego w Nielsen, M. A. & Chuang, I. L. (2010). Obliczenia kwantowe i informacje kwantowe.
Algorytm Grovera na Arxiv.org

Udostępnij za pośrednictwem