TextNerJob Classe

Riferimento

Configurazione per il processo NER di testo AutoML.

Inizializza una nuova attività Text NER autoML.

Ereditarietà: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextNerJob

Costruttore

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parametri

training_data

Necessario

Dati di training da usare per il training

validation_data

Necessario

Dati di convalida da usare per la valutazione del modello sottoposto a training

primary_metric

Necessario

Metrica primaria da visualizzare.

log_verbosity

Necessario

Livello di dettaglio del log

kwargs

Necessario

Argomenti specifici del processo

Metodi

dump	Esegue il dump del contenuto del processo in un file in formato YAML.
extend_search_space	Aggiungere (a) gli spazi di ricerca per questo processo NLP AutoML.
set_data
set_featurization
set_limits
set_sweep	Impostazioni di sweep per tutte le attività NLP di AutoML.
set_training_parameters	Correggere determinati parametri di training in tutta la procedura di training per tutti i candidati. Passare. Deve essere un numero intero positivo. :keyword learning_rate: frequenza di apprendimento iniziale. Deve essere un float in (0, 1). :keyword learning_rate_scheduler: tipo di utilità di pianificazione della frequenza di apprendimento. Deve scegliere tra "lineare", "coseno", "cosine_with_restarts", "polinomiale", "costante" e "constant_with_warmup". :keyword model_name: nome del modello da usare durante il training. Deve scegliere tra 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', 'xlnet-large-cased'. :keyword number_of_epochs: numero di periodi con cui eseguire il training. Deve essere un intero positivo. :keyword training_batch_size: dimensioni del batch durante il training. Deve essere un intero positivo. :keyword validation_batch_size: dimensioni del batch durante la convalida. Deve essere un intero positivo. :keyword warmup_ratio: rapporto tra i passaggi di training totali usati per un riscaldamento lineare da 0 a learning_rate. Deve essere un float in [0, 1]. :keyword weight_decay: valore di decadimento del peso quando optimizer è sgd, adam o adamw. Deve essere un valore float nell'intervallo [0, 1]. :return: nessuno.

dump

Esegue il dump del contenuto del processo in un file in formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametri

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Necessario

Percorso locale o flusso di file in cui scrivere il contenuto YAML. Se dest è un percorso di file, verrà creato un nuovo file. Se dest è un file aperto, il file verrà scritto direttamente in .

kwargs: dict

Argomenti aggiuntivi da passare al serializzatore YAML.

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

extend_search_space

Aggiungere (a) gli spazi di ricerca per questo processo NLP AutoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametri

value: Union[SearchSpace, List[SearchSpace]]

Necessario

un oggetto SearchSpace o un elenco di oggetti SearchSpace con parametri specifici di nlp.

Restituisce

Nessuno.

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

set_sweep

Impostazioni di sweep per tutte le attività NLP di AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametri

sampling_algorithm

Obbligatorio. Specifica il tipo di algoritmo di campionamento degli iperparametri. I valori possibili includono: "Grid", "Random" e "Bayesian".

early_termination

Criteri facoltativi di terminazione anticipata per terminare candidati di training con prestazioni scarse.

Restituisce

Nessuno

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

set_training_parameters

Correggere determinati parametri di training in tutta la procedura di training per tutti i candidati.

Passare. Deve essere un numero intero positivo. :keyword learning_rate: frequenza di apprendimento iniziale. Deve essere un float in (0, 1). :keyword learning_rate_scheduler: tipo di utilità di pianificazione della frequenza di apprendimento. Deve scegliere tra "lineare", "coseno", "cosine_with_restarts", "polinomiale", "costante" e "constant_with_warmup". :keyword model_name: nome del modello da usare durante il training. Deve scegliere tra 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', 'xlnet-large-cased'. :keyword number_of_epochs: numero di periodi con cui eseguire il training. Deve essere un intero positivo. :keyword training_batch_size: dimensioni del batch durante il training. Deve essere un intero positivo. :keyword validation_batch_size: dimensioni del batch durante la convalida. Deve essere un intero positivo. :keyword warmup_ratio: rapporto tra i passaggi di training totali usati per un riscaldamento lineare da 0 a learning_rate. Deve essere un float in [0, 1]. :keyword weight_decay: valore di decadimento del peso quando optimizer è sgd, adam o adamw. Deve essere un valore float nell'intervallo [0, 1]. :return: nessuno.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametri

gradient_accumulation_steps

numero di passaggi su cui accumulare sfumature prima di un'indietro

Eccezioni

FileExistsError

Generato se dest è un percorso di file e il file esiste già.

IOError

Generato se dest è un file aperto e il file non è scrivibile.

Attributi

base_path

Percorso di base della risorsa.

Restituisce

Percorso di base della risorsa.

Tipo restituito

str

creation_context

Contesto di creazione della risorsa.

Restituisce

Metadati di creazione per la risorsa.

Tipo restituito

Optional[SystemData]

featurization

id

L'ID della risorsa.

Restituisce

ID globale della risorsa, ID di Azure Resource Manager (ARM).

Tipo restituito

Optional[str]

inputs

limits

log_files

File di output del processo.

Restituisce

Dizionario di URL e nomi di log.

Tipo restituito

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

Stato del processo.

I valori comuni restituiti includono "Running", "Completed" e "Failed". Tutti i valori possibili sono:

NotStarted: si tratta di uno stato temporaneo in cui gli oggetti Run sul lato client si trovano prima dell'invio nel cloud.
Avvio: l'esecuzione è stata avviata nell'elaborazione nel cloud. Il chiamante ha un ID di esecuzione a questo punto.
Provisioning: l'ambiente di calcolo su richiesta viene creato per un invio di processo specificato.
Preparazione: l'ambiente di esecuzione viene preparato ed è in una delle due fasi seguenti:
- Compilazione di immagini Docker
- Configurazione dell'ambiente conda
In coda: il processo viene accodato nella destinazione di calcolo. Ad esempio, in BatchAI, il processo si trova in uno stato in coda

in attesa che tutti i nodi richiesti siano pronti.
In esecuzione: il processo è stato avviato per l'esecuzione nella destinazione di calcolo.
Finalizzazione: l'esecuzione del codice utente è stata completata e l'esecuzione è in fasi di post-elaborazione.
CancelRequested: l'annullamento è stato richiesto per il processo.
Completato: l'esecuzione è stata completata correttamente. Ciò include sia l'esecuzione del codice utente che l'esecuzione

fasi post-elaborazione.
Non riuscito: l'esecuzione non è riuscita. In genere la proprietà Error in un'esecuzione fornirà informazioni dettagliate sul motivo.
Annullata: segue una richiesta di annullamento e indica che l'esecuzione è stata annullata correttamente.
NotResponding : per le esecuzioni con heartbeat abilitati, non è stato inviato di recente alcun heartbeat.

Restituisce

Stato del processo.

Tipo restituito

Optional[str]

studio_url

Endpoint di Azure ML Studio.

Restituisce

URL della pagina dei dettagli del processo.

Tipo restituito

Optional[str]

sweep

task_type

Ottiene il tipo di attività.

Restituisce

Tipo di attività da eseguire. I valori possibili includono: "classification", "regression", "forecasting".

Tipo restituito

str

test_data

Ottenere i dati di test.

Restituisce

Testare l'input dei dati

Tipo restituito

Input

training_data

Ottenere i dati di training.

Restituisce

Input dei dati di training

Tipo restituito

Input

training_parameters

type

Tipo del processo.

Restituisce

Tipo del processo.

Tipo restituito

Optional[str]

validation_data

Ottenere i dati di convalida.

Restituisce

Input dei dati di convalida

Tipo restituito

Input

Condividi tramite

TextNerJob Classe

Costruttore

Parametri

Metodi

dump

Parametri

Eccezioni

extend_search_space

Parametri

Restituisce

Eccezioni

set_data

Eccezioni

set_featurization

Eccezioni

set_limits

Eccezioni

set_sweep

Parametri

Restituisce

Eccezioni

set_training_parameters

Parametri

Eccezioni

Attributi

base_path

Restituisce

Tipo restituito

creation_context

Restituisce

Tipo restituito

featurization

id

Restituisce

Tipo restituito

inputs

limits

log_files

Restituisce

Tipo restituito

log_verbosity

outputs

primary_metric

search_space

status

Restituisce

Tipo restituito

studio_url

Restituisce

Tipo restituito

sweep

task_type

Restituisce

Tipo restituito

test_data

Restituisce

Tipo restituito

training_data

Restituisce

Tipo restituito

training_parameters

type

Restituisce

Tipo restituito

validation_data

Restituisce

Tipo restituito

Commenti e suggerimenti

Risorse aggiuntive