Condividi tramite


Creare un indice vettoriale nel prompt flow di Azure Machine Learning (anteprima)

Azure Machine Learning consente di creare un indice vettoriale da file o cartelle nel computer, da una posizione in archiviazione nel cloud, da un asset di dati di Azure Machine Learning, da un repository Git o da un database SQL. Attualmente Azure Machine Learning può elaborare file .txt, md, .pdf, .xls e .docx. Inoltre, anziché creare un nuovo indice, è possibile riutilizzare un indice di Azure AI Search esistente (in precedenza Ricerca cognitiva).

Quando si crea un indice vettoriale, Azure Machine Learning crea blocchi di dati e crea incorporamenti, quindi archivia gli incorporamenti in un indice Faiss o in un indice di Azure AI Search. Oltre a ciò, Azure Machine Learning crea:

  • Dati di test per l'origine dati.

  • Prompt flow campione, che usa l'indice vettoriale creato. Le funzionalità del prompt flow campione includono:

    • Varianti di richiesta generate automaticamente.
    • Valutazione di ogni variante di richiesta usando i dati di test generati.
    • Metriche per ogni variante di richiesta per scegliere la variante migliore da eseguire.

    Il campione è utilizzabile per continuare a sviluppare la richiesta.

Importante

Questa funzionalità è attualmente in anteprima pubblica. Questa versione di anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero presentare funzionalità limitate.

Per altre informazioni, vedere le Condizioni supplementari per l'uso delle anteprime di Microsoft Azure.

Prerequisiti

  • Una sottoscrizione di Azure. Se non hai una sottoscrizione di Azure, crea un account gratuito.

  • Accesso al Servizio OpenAI di Azure.

  • Prompt flow abilitati nell'area di lavoro di Azure Machine Learning. È possibile abilitare i flussi di richiesta attivando le soluzioni Build IA con prompt flow nel pannello Gestisci funzionalità di anteprima.

Creare un indice vettoriale usando studio di Machine Learning

  1. Selezionare Prompt flow nel menu di sinistra.

    Screenshot that shows the location of prompt flow on the left menu.

  2. Selezionare la scheda Indice vettoriale.

    Screenshot that shows the tab for vector index.

  3. Seleziona Crea.

  4. All’apertura del modulo per la creazione di un indice vettoriale, specificare un nome per l'indice vettoriale.

    Screenshot that shows basic settings for creating a vector index.

  5. Selezionare il tipo di origine dati.

  6. In base al tipo scelto, specificare i dettagli della posizione per l'origine. Quindi seleziona Avanti.

  7. Esaminare i dettagli dell'indice vettoriale e quindi selezionare il pulsante Crea.

  8. Nella pagina di panoramica visualizzata è possibile tenere traccia e visualizzare lo stato della creazione dell'indice vettoriale. Il processo potrebbe richiedere del tempo, a seconda delle dimensioni dei dati.

Aggiungere un indice vettoriale a un prompt flow

Una creato l’indice vettoriale, è possibile aggiungerlo a un prompt flow dal canvas del prompt flow.

  1. Aprire un prompt flow esistente.

  2. Nel menu in alto della finestra di progettazione del prompt flow, selezionare Altri strumenti e quindi selezionare Ricerca indice.

    Screenshot that shows the list of available tools.

    Lo strumento Ricerca indice viene aggiunto al canvas. Se lo strumento non viene visualizzato immediatamente, scorrere fino alla fine del canvas.

    Screenshot that shows the Vector Index Lookup tool.

  3. Selezionare la casella del valore mlindex_content e selezionare l'indice. Lo strumento deve rilevare l'indice creato nella sezione "Creare un indice vettoriale" dell'esercitazione. Dopo aver compilato tutte le informazioni necessarie, selezionare Salva per chiudere il pannello di generazione.

  4. Immettere le query e i query_types da eseguire sull'indice.

    In questo caso, un esempio di stringa di testo normale che è possibile immettere è: How to use SDK V2?'. Here is an example of an embedding as an input: $ {embed_the_question.output}'. L’inserimento di una stringa di testo normale funzionerà solo quando l'indice vettoriale viene usato nell'area di lavoro che lo ha creato.

Tipi di file supportati

Tipi di file supportati per la creazione di un processo di indice vettoriale: .txt, .html.md, .htm, .py, .docx.ppt.pptx.doc.pdf, . .xlsx.xls Tutti gli altri tipi di file verranno ignorati durante la creazione.

Passaggi successivi

Attività iniziali con RAG utilizzando un esempio di prompt flow (anteprima)

Usare archivi di vettori con Azure Machine Learning (anteprima)