Krok 1. Klonování úložiště kódu a vytvoření výpočetních prostředků
Článek
Podívejte se na úložiště GitHub pro vzorový kód v této části. Kód úložiště můžete použít také jako šablonu, pomocí které můžete vytvářet vlastní aplikace AI.
Tímto postupem načtete ukázkový kód do pracovního prostoru Databricks a nakonfigurujete globální nastavení pro aplikaci.
Přístup pro zápis k existující jednotce Unity Catalogschemawhere, kam se ukládá výstup rozdílové Delta tables, který obsahuje analyzované a blokované dokumenty a indexy vektorového vyhledávání, nebo oprávnění k vytvoření nové catalog a schema (v tomto případě pro vás nastavovací poznámkový blok vytvoří jedno).
Jeden uživatelský cluster se spuštěným DBR 14.3 nebo novějším, který má přístup k internetu. Ke stažení potřebných balíčků Pythonu a systémových balíčků se vyžaduje přístup k internetu. Nepoužívejte cluster se spuštěným modulem Databricks Runtime pro Machine Learning, protože tyto kurzy mají konflikty s balíčkem Python s modulem Databricks Runtime ML.
Diagram toku kurzu
Diagram znázorňuje tok kroků použitých v tomto kurzu.
Pokyny
Naklonujte toto úložiště do svého pracovního prostoru pomocí složek Gitu.
Otevřete poznámkový blok rag_app_sample_code/00_global_config a upravte nastavení.
# The name of the RAG application. This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes
RAG_APP_NAME = 'my_agent_app'
# Unity Catalog catalog and schema where outputs tables and indexes are saved
# If this catalog/schema does not exist, you need create catalog/schema permissions.
UC_CATALOG = f'{user_name}_catalog'
UC_SCHEMA = f'rag_{user_name}'
## Name of model in Unity Catalog where the POC chain is logged
UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
# Vector Search endpoint where index is loaded
# If this does not exist, it will be created
VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
# Source location for documents
# You need to create this location and add files
SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
Otevřete a spusťte poznámkový blok 01_validate_config_and_create_resources.