Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
La funzionalità Ricerca contenuto app abilitata dalle API windows per intelligenza artificiale consente agli sviluppatori di app di integrare funzionalità di ricerca intelligenti nelle app di Windows usando l'API AppContentIndexer . Eseguendo l'indicizzazione del contenuto in-app e rendendolo ricercabile tramite query semantiche, gli utenti possono recuperare i risultati non solo in base alle parole chiave esatte, ma anche al significato semantico. È possibile usare questo indice semantico per migliorare i propri assistenti di intelligenza artificiale con conoscenze specifiche del dominio, creando esperienze più personalizzate e specifiche del contesto.
Usare questa API per:
Creare esperienze di ricerca in-app che usano ricerca semantica e lessicale. Gli utenti possono cercare in base al significato, oltre alle corrispondenze esatte delle parole chiave, semplificando la ricerca di informazioni pertinenti.
Supportare Retrieval-Augmented Generazione (RAG) abilitando il recupero della conoscenza locale. Se abbinato a un modello LLM (Large Language Model), questo consente di recuperare il contenuto più pertinente dalla knowledge base dell'app e generare risposte più accurate e con riconoscimento del contesto.
L'API ApplicationContentIndexer è attualmente disponibile solo in Windows App SDK versione 2.0 Sperimentale 2.
L'app AI Dev Gallery offre un esempio interattivo dell'API AppContentIndexer che consente di sperimentare la funzionalità Ricerca contenuto app. Altre informazioni su AI Dev Gallery, tra cui come eseguire l'installazione da Microsoft Store o dal codice sorgente in GitHub.
Che cos'è l'API AppContentIndexer?
L'API AppContentIndexer consente alle app di rendere ricercabile il testo e il contenuto dell'immagine usando sia la ricerca lessicale (lessicale) basata su parole chiave che la ricerca semantica, senza che gli sviluppatori comprendano la complessità sottostante.
Dietro le quinte, usa tecniche avanzate come l'incorporamento di vettori, i database vettoriali e l'indicizzazione del testo tradizionale, ma questi dettagli sono completamente astratti. Gli sviluppatori interagiscono con un'API semplice di alto livello. Quando il contenuto viene indicizzato, il sistema archivia vettori di incorporamento (che acquisisce significato semantico) insieme agli identificatori di contenuto. Le richieste di ricerca restituiscono quindi identificatori basati su corrispondenze di parole chiave o somiglianza semantica. Ad esempio, la ricerca di "gattino" potrebbe restituire testo correlato su gatti o immagini di gattini. Le ricerche semantiche funzionano meglio con frasi descrittive, quindi una query come "gatti seduti su finestre" è più probabile che producano risultati altamente rilevanti.
L'indice viene salvato in modo permanente su disco, quindi la reindicizzazione non è necessaria in ogni avvio dell'app.
Ricerca semantica e lessicale
Internamente, ApplicationContentIndexer utilizza una combinazione di indicizzazione del testo tradizionale e ricerca moderna basata su vettori e embedding. Questi dettagli sono astratti: gli sviluppatori non devono gestire direttamente i modelli di incorporamento, l'archiviazione vettoriale o l'infrastruttura di recupero.
È possibile eseguire query sull'indice usando una stringa normale. La query può restituire:
- Corrispondenze lessicali : corrispondenze di testo esatte (incluso il testo trovato all'interno delle immagini).
- Corrispondenze semantiche : contenuto simile nel significato, anche se le parole non sono identiche.
Ad esempio, una query per "gattino" potrebbe restituire un riferimento a:
- Voci di testo sui gatti, anche se la parola "gattino" non è menzionata in modo esplicito.
- Immagini che contengono visivamente gattini.
- Contenuto testuale nelle immagini che contengono "cat" o parole con rilevanza semantica sufficiente.
Tipi di contenuto supportati
ApplicationContentIndexer supporta l'aggiunta dei tipi di contenuto seguenti:
- Testo : contenuto testo normale o strutturato.
- Immagini : inclusi screenshot, foto o file di immagine che contengono testo o elementi visivi riconoscibili.
Identificatori di contenuto definiti dall'app
AppContentIndexer supporta il contenuto gestito dall'app consentendo alle app di indicizzare gli elementi usando identificatori di contenuto definiti dall'app. Le query restituiscono questi identificatori, che l'app usa per recuperare il contenuto effettivo dal proprio archivio dati.
Le query di testo restituiscono oggetti AppManagedTextQueryMatch e le query immagine restituiscono oggetti AppManagedImageQueryMatch, entrambi includono solo ContentId, non il contenuto stesso.
Per indicazioni su come integrare questa funzionalità nell'app e usare l'API ApplicationContentIndexer, vedere: Avvio rapido: Ricerca contenuto app
Privacy e sicurezza
Gli indici semantici e lessicali vengono generati per conto dell'app e archiviati nella cartella dati dell'app locale dell'app. Come parte della versione di anteprima privata, questa funzionalità è destinata all'indicizzazione del contenuto dell'applicazione non sensibile. Per le procedure di sicurezza consigliate, non usare questa funzionalità per indicizzare i dati utente che possono contenere informazioni personali, confidenziali o sensibili.
Considerazioni sull'IA responsabile
Le funzionalità di indicizzazione semantica e ricerca in questa anteprima non applicano alcuna forma di moderazione del contenuto, né tentano di rilevare o attenuare la distorsione semantica introdotta dai modelli sottostanti. Gli sviluppatori sono responsabili della valutazione e della gestione dei potenziali rischi durante l'implementazione di funzionalità basate sull'intelligenza artificiale.
È consigliabile esaminare le linee guida per lo sviluppo di intelligenza artificiale generativa responsabile in Windows per le procedure consigliate per la creazione di esperienze di intelligenza artificiale nell'app.