Creare e gestire documenti di training

Traduttore personalizzato consente di creare modelli di traduzione che riflettano la terminologia e lo stile specifici del settore e dell'azienda. Il training e la distribuzione di un modello personalizzato sono operazioni semplici e non richiedono alcuna competenza di programmazione. Traduttore personalizzato consente di caricare file paralleli, file di memoria di traduzione o file ZIP.

I documenti paralleli sono coppie di documenti in cui uno (destinazione) è la traduzione dell'altro (origine). Un documento della coppia contiene frasi nella lingua di origine, mentre l'altro contiene le stesse frasi tradotte nella lingua di destinazione.

Prima di caricare i documenti, consultare la guida ai formati dei documenti e alle convenzioni di denominazione per assicurarsi che il formato del file sia supportato da Traduttore personalizzato.

Procedura: creazione di set di documenti

La ricerca di dati di qualità nel dominio è spesso un'attività complessa che varia in base alla classificazione degli utenti. Ecco alcune domande che è possibile porsi quando si valutano i dati disponibili:

  • Le aziende hanno spesso un'ampia gamma di dati di traduzione accumulati in molti anni di utilizzo della traduzione umana. L'azienda dispone di dati di traduzione precedenti che è possibile usare?

  • Si dispone di una grande quantità di dati monolingue? I dati monolingue sono dati in una sola lingua. In tal caso, è possibile ottenere traduzioni per questi dati?

  • È possibile eseguire la ricerca per indicizzazione nei portali online per raccogliere frasi di origine e sintetizzare le frasi di destinazione?

Materiale di training per ogni tipo di documento

Origine Risultato Regole da seguire
Documenti di training bilingue Insegna al sistema la terminologia e lo stile. Essere moderati. Qualsiasi traduzione umana in-domain è migliore della traduzione automatica. Aggiungere e rimuovere documenti man mano che si procede e provare a migliorare il Punteggio BLEU.
Ottimizzazione dei documenti Esegue il training dei parametri Neural Machine Translation. Essere rigidi. Comporre questi elementi in modo che siano rappresentativi in modo ottimale di ciò che si intende tradurre in futuro.
Documenti di prova Calcolare il punteggio BLEU. Essere rigidi. Comporre i documenti di prova in modo che siano rappresentativi in modo ottimale di ciò che si prevede di tradurre in futuro.
Dizionario di espressioni Forza sempre la traduzione specificata. Essere restrittivi. Un dizionario di espressioni fa distinzione tra maiuscole e minuscole e qualsiasi parola o espressione elencata viene tradotta nel modo specificato. In molti casi, è preferibile non usare un dizionario di espressioni e consentire al sistema di apprendere.
Dizionario di frasi Forza sempre la traduzione specificata. Essere rigidi. Un dizionario di frasi non fa distinzione tra maiuscole e minuscole ed è adatto per frasi brevi di dominio e comuni. La corrispondenza con una frase del dizionario si verifica se l'intera frase inviata corrisponde alla voce di origine del dizionario. Se solo una parte della frase corrisponde, la corrispondenza con la voce non si verifica.

Come caricare i documenti

I tipi di documento sono associati alla coppia di lingue selezionata quando si crea un progetto.

  1. Accedere al portale di Traduttore personalizzato. L'area di lavoro predefinita viene caricata e viene visualizzato un elenco di progetti creati in precedenza.

  2. Selezionare il nome del progetto desiderato. Per impostazione predefinita, viene selezionato il pannello Gestisci documenti e viene visualizzato un elenco di documenti caricati in precedenza.

  3. Selezionare Aggiungi set di documenti e scegliere il tipo di documento:

    • Set di training
    • Set di test
    • Set di ottimizzazione
    • Set di dizionari:
      • Dizionario di espressioni
      • Dizionario di frasi
  4. Seleziona Avanti.

    Screenshot illustrating the document upload link.

    Nota

    Se si sceglie Set di dizionari viene avviata la finestra di dialogo Scegli tipo di dizionario. Scegliere un tipo e selezionare Avanti

  5. Selezionare il formato dei documenti dai pulsanti di opzione.

    Screenshot illustrating the upload document page.

    • Per Documenti paralleli, compilare il Document set name e selezionare Sfoglia file per selezionare i documenti di origine e di destinazione.
    • Per il file Memoria di traduzione (TM) o Caricare più set con zip, selezionare Sfoglia file per selezionare il file
  6. Selezionare Carica.

A questo punto, Traduttore personalizzato elabora i documenti e tenta di estrarre frasi come indicato nella notifica di caricamento. Al termine dell'elaborazione, verrà visualizzata la notifica di caricamento riuscito.

Screenshot illustrating the upload document processing dialog window.

Visualizzare la cronologia dei caricamenti

Nella pagina dell'area di lavoro è possibile visualizzare la cronologia di tutti i caricamenti di documenti con dettagli come il tipo di documento, la coppia di lingue, lo stato di caricamento e così via.

  1. Dal portale di Traduttore personalizzato fare clic sulla scheda Cronologia caricamenti per visualizzare la cronologia.

    Screenshot showing the upload history tab.

  2. Questa pagina mostra lo stato di tutti i caricamenti precedenti. I caricamenti sono visualizzati in ordine dal più recente al meno recente. Per ogni caricamento sono indicati il nome del documento, lo stato di caricamento, la data di caricamento, il numero di file caricati, il tipo di file caricato, la coppia di lingue del file e il nome del creatore. È possibile usare Filtro per trovare rapidamente i documenti in base al nome, allo stato, alla lingua e all'intervallo di date.

    Screenshot showing the upload history page.

  3. Selezionare uno dei record nella cronologia dei caricamenti. Nella pagina dei dettagli della cronologia dei caricamenti è possibile visualizzare i file caricati come parte del processo di caricamento, lo stato di caricamento del file, la lingua del file ed eventuali messaggi di errore in caso di errori durante il caricamento.

Passaggi successivi