Özel Metin Analizi sistem durumu modeli için eğitin
Makale
Eğitim, modelin etiketlenmiş verilerinizden öğrendiği süreçtir. Eğitim tamamlandıktan sonra modelinizi geliştirmeniz gerekip gerekmediğini belirlemek için modelin performansını görüntüleyebileceksiniz.
Modeli eğitmek için bir eğitim işi başlatırsınız ve yalnızca başarıyla tamamlanan işler bir model oluşturur. Eğitim işlerinin süresi yedi gün sonra dolacak ve bu süre sonunda iş ayrıntılarını alamayacaksınız. Eğitim işiniz başarıyla tamamlandıysa ve bir model oluşturulduysa model etkilenmez. Aynı anda çalışan yalnızca bir eğitim işiniz olabilir ve aynı projedeki diğer işleri başlatamazsınız.
Eğitim süreleri, veri kümesi boyutuna ve şemanızın karmaşıklığına bağlı olarak birkaç saate kadar birkaç belgeyle ilgilenirken birkaç dakika içinde olabilir.
Eğitim sürecine başlamadan önce, projenizdeki etiketli belgeler eğitim kümesine ve test kümesine ayrılır. Her biri farklı bir işleve hizmet eder.
Eğitim kümesi modeli eğitmek için kullanılır. Bu küme, modelin etiketlenmiş varlıkları ve hangi metin aralıklarının varlık olarak ayıklandığını öğrendiği kümedir.
Test kümesi , eğitim sırasında değil yalnızca değerlendirme sırasında modele tanıtılmayan bir kör kümedir.
Model eğitimi başarıyla tamamlandıktan sonra model, testteki belgelerden tahmin yapmak için kullanılır ve bu tahminlere dayalı değerlendirme ölçümleri hesaplanır. Model eğitimi ve değerlendirmesi yalnızca öğrenilen bileşenlere sahip yeni tanımlanan varlıklar içindir; bu nedenle, sistem durumu varlıkları için Metin Analizi, önceden oluşturulmuş bileşenlere sahip varlıklar olmaları nedeniyle model eğitimi ve değerlendirmesinin dışında tutulur. Etiketlenmiş tüm varlıklarınızın hem eğitim hem de test kümesinde yeterince temsil edilmiş olduğundan emin olun.
Sistem durumu için özel Metin Analizi, veri bölme için iki yöntemi destekler:
Test kümesini eğitim verilerinden otomatik olarak bölme:Sistem, etiketlenmiş verilerinizi seçtiğiniz yüzdelere göre eğitim ve test kümeleri arasında böler. Önerilen bölme yüzdesi eğitim için %80 ve test için %20'dir.
Not
Test kümesini eğitim verilerinden otomatik olarak böl seçeneğini belirlerseniz, yalnızca eğitim kümesine atanan veriler sağlanan yüzdelere göre bölünür.
Eğitim ve test verilerinin el ile bölünmesini kullanın: Bu yöntem, kullanıcıların hangi etiketli belgelerin hangi kümeye ait olması gerektiğini tanımlamasını sağlar. Bu adım yalnızca veri etiketleme sırasında test kümenize belge eklediyseniz etkinleştirilir.
Modelinizi Language Studio'dan eğitmeye başlamak için:
Sol taraftaki menüden Eğitim işleri'ni seçin.
Üstteki menüden Eğitim işi başlat'ı seçin.
Yeni model eğit'i seçin ve metin kutusuna model adını yazın. Ayrıca , bu seçeneği belirleyip açılan menüden üzerine yazmak istediğiniz modeli seçerek mevcut modelin üzerine yazabilirsiniz. Eğitilen modelin üzerine yazmak geri alınamaz, ancak yeni modeli dağıtana kadar dağıtılan modellerinizi etkilemez.
Veri bölme yöntemini seçin. Test kümesini eğitim verilerinden otomatik olarak bölme'yi seçebilirsiniz; burada sistem etiketlenmiş verilerinizi belirtilen yüzdelere göre eğitim ve test kümeleri arasında böler. Ya da eğitim ve test verilerinin el ile bölünmesini kullanabilirsiniz. Bu seçenek yalnızca test kümenize belge eklediyseniz etkinleştirilir. Veri ayırma hakkında bilgi için bkz. veri etiketleme ve modeli eğitme.
Eğit düğmesini seçin.
Listeden Eğitim İşi Kimliği'ni seçerseniz, bu işin Eğitim ilerleme durumunu, İş durumunu ve diğer ayrıntıları denetleyebileceğiniz bir yan bölme görüntülenir.
Not
Yalnızca başarıyla tamamlanan eğitim işleri model oluşturur.
Eğitim, etiketlenmiş verilerinizin boyutuna bağlı olarak birkaç dakika ile birkaç saat arasında sürebilir.
Aynı anda yalnızca bir eğitim işi çalıştırabilirsiniz. Çalışan iş tamamlanana kadar aynı proje içinde başka bir eğitim işi başlatamazsınız.
Eğitim işini başlatma
Bir eğitim işi göndermek için aşağıdaki URL'yi, üst bilgileri ve JSON gövdesini kullanarak bir POST isteği gönderin. Yer tutucu değerlerini kendi değerlerinizle değiştirin.
Projenizin adı. Bu değer büyük/küçük harfe duyarlıdır.
myProject
{API-VERSION}
Çağırdığınız API'nin sürümü. Burada başvuruda bulunılan değer, yayınlanan en son sürüme yöneliktir. Diğer kullanılabilir API sürümleri hakkında daha fazla bilgi edinmek için bkz . Model yaşam döngüsü .
2022-05-01
Üst Bilgiler
İsteğinizin kimliğini doğrulamak için aşağıdaki üst bilgiyi kullanın.
Anahtar
Değer
Ocp-Apim-Subscription-Key
Kaynağınızın anahtarı. API isteklerinizin kimliğini doğrulamak için kullanılır.
Request body
İstek gövdesinde aşağıdaki JSON'yi kullanın. Eğitim tamamlandıktan sonra modele {MODEL-NAME} verilir. Yalnızca başarılı eğitim işleri model üretir.
Verilerinizi eğitim ve test kümelerine bölme seçeneği.
{}
tür
percentage
Bölünmüş yöntemler. Olası değerler: percentage veya manual. Daha fazla bilgi için bkz . Modeli eğitma.
percentage
trainingSplitPercentage
80
Eğitim kümesine eklenecek etiketli verilerinizin yüzdesi. Önerilen değer: 80.
80
testingSplitPercentage
20
Test kümesine eklenecek etiketli verilerinizin yüzdesi. Önerilen değer: 20.
20
Not
trainingSplitPercentage ve testingSplitPercentage yalnızca olarak ayarlandıysa Kindpercentage gereklidir ve her iki yüzdenin toplamı 100'e eşit olmalıdır.
API isteğinizi gönderdikten sonra, işin doğru şekilde gönderildiğini belirten bir 202 yanıt alırsınız. Yanıt üst bilgilerinde değeri ayıklayın location . Şu şekilde biçimlendirilir:
{JOB-ID} bu işlem zaman uyumsuz olduğundan isteğinizi tanımlamak için kullanılır. Eğitim durumunu almak için bu URL'yi kullanabilirsiniz.
Eğitim işi durumunu alma
Eğitim, eğitim verilerinizin boyutuna ve şemanızın karmaşıklığına bağlı olarak zaman alabilir. Başarıyla tamamlanana kadar eğitim işinin durumunu yoklamayı sürdürmek için aşağıdaki isteği kullanabilirsiniz.
Modelinizin eğitim ilerleme durumunu almak için aşağıdaki GET isteğini kullanın. Aşağıdaki yer tutucu değerlerini kendi değerlerinizle değiştirin.
Projenizin adı. Bu değer büyük/küçük harfe duyarlıdır.
myProject
{JOB-ID}
Modelinizin eğitim durumunu bulma kimliği. Bu değer, önceki adımda aldığınız üst bilgi değerindedir location .
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Çağırdığınız API'nin sürümü. Burada başvuruda bulunılan değer, yayınlanan en son sürüme yöneliktir. Diğer kullanılabilir API sürümleri hakkında daha fazla bilgi edinmek için bkz . Model yaşam döngüsü .
2022-05-01
Üst Bilgiler
İsteğinizin kimliğini doğrulamak için aşağıdaki üst bilgiyi kullanın.
Anahtar
Değer
Ocp-Apim-Subscription-Key
Kaynağınızın anahtarı. API isteklerinizin kimliğini doğrulamak için kullanılır.
Yanıt Gövdesi
İsteği gönderdikten sonra aşağıdaki yanıtı alırsınız.
Language Studio'dan bir eğitim işini iptal etmek için Eğitim işleri sayfasına gidin. İptal etmek istediğiniz eğitim işini seçin ve üstteki menüden İptal'i seçin.
Bir eğitim işini iptal etmek için aşağıdaki URL' yi, üst bilgileri ve JSON gövdesini kullanarak bir POST isteği oluşturun.
İstek URL’si
API isteğinizi oluştururken aşağıdaki URL'yi kullanın. Aşağıdaki yer tutucu değerlerini kendi değerlerinizle değiştirin.
Projenizin adı. Bu değer büyük/küçük harfe duyarlıdır.
EmailApp
{JOB-ID}
Bu değer, eğitim işi kimliğidir.
XXXXX-XXXXX-XXXX-XX
{API-VERSION}
Çağırdığınız API'nin sürümü. Başvuruda bulunılan değer, en son yayımlanan model sürümüne yöneliktir.
2022-05-01
Üst Bilgiler
İsteğinizin kimliğini doğrulamak için aşağıdaki üst bilgiyi kullanın.
Anahtar
Değer
Ocp-Apim-Subscription-Key
Kaynağınızın anahtarı. API isteklerinizin kimliğini doğrulamak için kullanılır.
API isteğinizi gönderdikten sonra, işin durumunu denetlemek için kullanılan üst bilgi içeren bir Operation-Location 202 yanıtı alırsınız.
Sonraki adımlar
Eğitim tamamlandıktan sonra, gerekirse modelinizi isteğe bağlı olarak geliştirmek için modelin performansını görüntüleyebilirsiniz. Modelinizden memnun olduktan sonra, modeli dağıtarak metinden varlıkları ayıklamak için kullanılabilir hale getirebilirsiniz.