TextNerJob Classe
Configurazione per il processo NER di testo AutoML.
Inizializza una nuova attività Text NER autoML.
- Ereditarietà
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextNerJob
Costruttore
TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parametri
- training_data
Dati di training da usare per il training
- validation_data
Dati di convalida da usare per la valutazione del modello sottoposto a training
- primary_metric
Metrica primaria da visualizzare.
- log_verbosity
Livello di dettaglio del log
- kwargs
Argomenti specifici del processo
Metodi
dump |
Esegue il dump del contenuto del processo in un file in formato YAML. |
extend_search_space |
Aggiungere (a) gli spazi di ricerca per questo processo NLP AutoML. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Impostazioni di sweep per tutte le attività NLP di AutoML. |
set_training_parameters |
Correggere determinati parametri di training in tutta la procedura di training per tutti i candidati. Passare. Deve essere un numero intero positivo. :keyword learning_rate: frequenza di apprendimento iniziale. Deve essere un float in (0, 1). :keyword learning_rate_scheduler: tipo di utilità di pianificazione della frequenza di apprendimento. Deve scegliere tra "lineare", "coseno", "cosine_with_restarts", "polinomiale", "costante" e "constant_with_warmup". :keyword model_name: nome del modello da usare durante il training. Deve scegliere tra 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', 'xlnet-large-cased'. :keyword number_of_epochs: numero di periodi con cui eseguire il training. Deve essere un intero positivo. :keyword training_batch_size: dimensioni del batch durante il training. Deve essere un intero positivo. :keyword validation_batch_size: dimensioni del batch durante la convalida. Deve essere un intero positivo. :keyword warmup_ratio: rapporto tra i passaggi di training totali usati per un riscaldamento lineare da 0 a learning_rate. Deve essere un float in [0, 1]. :keyword weight_decay: valore di decadimento del peso quando optimizer è sgd, adam o adamw. Deve essere un valore float nell'intervallo [0, 1]. :return: nessuno. |
dump
Esegue il dump del contenuto del processo in un file in formato YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametri
Percorso locale o flusso di file in cui scrivere il contenuto YAML. Se dest è un percorso di file, verrà creato un nuovo file. Se dest è un file aperto, il file verrà scritto direttamente in .
- kwargs
- dict
Argomenti aggiuntivi da passare al serializzatore YAML.
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
extend_search_space
Aggiungere (a) gli spazi di ricerca per questo processo NLP AutoML.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parametri
- value
- Union[SearchSpace, List[SearchSpace]]
un oggetto SearchSpace o un elenco di oggetti SearchSpace con parametri specifici di nlp.
Restituisce
Nessuno.
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
set_sweep
Impostazioni di sweep per tutte le attività NLP di AutoML.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parametri
- sampling_algorithm
Obbligatorio. Specifica il tipo di algoritmo di campionamento degli iperparametri. I valori possibili includono: "Grid", "Random" e "Bayesian".
- early_termination
Criteri facoltativi di terminazione anticipata per terminare candidati di training con prestazioni scarse.
Restituisce
Nessuno
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
set_training_parameters
Correggere determinati parametri di training in tutta la procedura di training per tutti i candidati.
Passare. Deve essere un numero intero positivo. :keyword learning_rate: frequenza di apprendimento iniziale. Deve essere un float in (0, 1). :keyword learning_rate_scheduler: tipo di utilità di pianificazione della frequenza di apprendimento. Deve scegliere tra "lineare", "coseno", "cosine_with_restarts", "polinomiale", "costante" e "constant_with_warmup". :keyword model_name: nome del modello da usare durante il training. Deve scegliere tra 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', 'xlnet-large-cased'. :keyword number_of_epochs: numero di periodi con cui eseguire il training. Deve essere un intero positivo. :keyword training_batch_size: dimensioni del batch durante il training. Deve essere un intero positivo. :keyword validation_batch_size: dimensioni del batch durante la convalida. Deve essere un intero positivo. :keyword warmup_ratio: rapporto tra i passaggi di training totali usati per un riscaldamento lineare da 0 a learning_rate. Deve essere un float in [0, 1]. :keyword weight_decay: valore di decadimento del peso quando optimizer è sgd, adam o adamw. Deve essere un valore float nell'intervallo [0, 1]. :return: nessuno.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parametri
- gradient_accumulation_steps
numero di passaggi su cui accumulare sfumature prima di un'indietro
Eccezioni
Generato se dest è un percorso di file e il file esiste già.
Generato se dest è un file aperto e il file non è scrivibile.
Attributi
base_path
creation_context
Contesto di creazione della risorsa.
Restituisce
Metadati di creazione per la risorsa.
Tipo restituito
featurization
id
L'ID della risorsa.
Restituisce
ID globale della risorsa, ID di Azure Resource Manager (ARM).
Tipo restituito
inputs
limits
log_files
File di output del processo.
Restituisce
Dizionario di URL e nomi di log.
Tipo restituito
log_verbosity
outputs
primary_metric
search_space
status
Stato del processo.
I valori comuni restituiti includono "Running", "Completed" e "Failed". Tutti i valori possibili sono:
NotStarted: si tratta di uno stato temporaneo in cui gli oggetti Run sul lato client si trovano prima dell'invio nel cloud.
Avvio: l'esecuzione è stata avviata nell'elaborazione nel cloud. Il chiamante ha un ID di esecuzione a questo punto.
Provisioning: l'ambiente di calcolo su richiesta viene creato per un invio di processo specificato.
Preparazione: l'ambiente di esecuzione viene preparato ed è in una delle due fasi seguenti:
Compilazione di immagini Docker
Configurazione dell'ambiente conda
In coda: il processo viene accodato nella destinazione di calcolo. Ad esempio, in BatchAI, il processo si trova in uno stato in coda
in attesa che tutti i nodi richiesti siano pronti.
In esecuzione: il processo è stato avviato per l'esecuzione nella destinazione di calcolo.
Finalizzazione: l'esecuzione del codice utente è stata completata e l'esecuzione è in fasi di post-elaborazione.
CancelRequested: l'annullamento è stato richiesto per il processo.
Completato: l'esecuzione è stata completata correttamente. Ciò include sia l'esecuzione del codice utente che l'esecuzione
fasi post-elaborazione.
Non riuscito: l'esecuzione non è riuscita. In genere la proprietà Error in un'esecuzione fornirà informazioni dettagliate sul motivo.
Annullata: segue una richiesta di annullamento e indica che l'esecuzione è stata annullata correttamente.
NotResponding : per le esecuzioni con heartbeat abilitati, non è stato inviato di recente alcun heartbeat.
Restituisce
Stato del processo.
Tipo restituito
studio_url
Endpoint di Azure ML Studio.
Restituisce
URL della pagina dei dettagli del processo.
Tipo restituito
sweep
task_type
Ottiene il tipo di attività.
Restituisce
Tipo di attività da eseguire. I valori possibili includono: "classification", "regression", "forecasting".
Tipo restituito
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per