Pemecahan masalah kesalahan dan peringatan pengindeks umum di Azure AI Search

Artikel ini menyediakan informasi dan solusi untuk kesalahan umum dan peringatan yang mungkin Anda temui selama pengindeksan dan pengayaan AI di Azure AI Search.

Pengindeksan berhenti ketika jumlah kesalahan melebihi 'maxFailedItems'.

Jika Anda ingin pengindeks mengabaikan kesalahan ini (dan melewati "dokumen yang gagal"), pertimbangkan untuk memperbarui maxFailedItems dan maxFailedItemsPerBatch seperti yang dijelaskan di sini.

Catatan

Setiap dokumen yang gagal bersama dengan kunci dokumennya (bila tersedia) akan muncul sebagai kesalahan dalam status eksekusi pengindeks. Anda dapat menggunakan api indeks untuk mengunggah dokumen secara manual di titik selanjutnya jika Anda telah mengatur pengindeks untuk mentolerir kegagalan.

Informasi kesalahan dalam artikel ini bisa membantu Anda mengatasi kesalahan, memperbolehkan pengindeksan dilanjutkan.

Peringatan tidak menghentikan pengindeksan, tetapi menunjukkan kondisi yang dapat mengakibatkan hasil yang tidak terduga. Apakah Anda mengambil tindakan atau tidak tergantung pada data dan skenario Anda.

Di mana Anda dapat menemukan kesalahan pengindeks tertentu?

Untuk memverifikasi status pengindeks dan mengidentifikasi kesalahan dalam portal Azure, ikuti langkah-langkah di bawah ini:

  1. Navigasi ke portal Azure dan temukan layanan Pencarian AI Anda.
  2. Setelah Anda berada di layanan Pencarian AI, klik tab 'Pengindeks'.
  3. Dari daftar pengindeks, identifikasi pengindeks tertentu yang ingin Anda verifikasi.
  4. Di bawah kolom 'Riwayat Eksekusi', klik hyperlink 'Status' yang terkait dengan pengindeks yang dipilih.
  5. Jika ada kesalahan, arahkan mouse ke atas pesan kesalahan. Panel akan muncul di sisi kanan layar Anda yang menampilkan informasi terperinci tentang kesalahan tersebut.

Kesalahan sementara

Untuk berbagai alasan, seperti gangguan komunikasi jaringan sementara, batas waktu dari proses yang berjalan lama, atau nuansa dokumen tertentu, biasanya mengalami kesalahan sementara atau peringatan selama pengindeks berjalan. Namun, kesalahan ini bersifat sementara dan harus diselesaikan dalam eksekusi pengindeks berikutnya.

Untuk mengelola kesalahan ini secara efektif, disarankan untuk menempatkan pengindeks Anda pada jadwal, misalnya, untuk berjalan setiap lima menit. Ini berarti eksekusi berikutnya akan dimulai lima menit setelah penyelesaian eksekusi pertama, mematuhi batas runtime maksimum. Eksekusi yang dijadwalkan secara teratur membantu memperbaiki kesalahan sementara atau peringatan dengan cepat.

Jika Anda melihat kesalahan yang berlanjut selama beberapa pengindeks berjalan, kemungkinan itu bukan masalah sementara. Dalam kasus seperti itu, lihat daftar di bawah ini untuk solusi potensial. Harap dicatat, selalu pastikan jadwal pengindeksan Anda selaras dengan batasan yang diuraikan dalam panduan batas pengindeks kami.

Properti kesalahan

Dimulai dengan versi API2019-05-06, kesalahan dan peringatan Pengindeks tingkat item disusun untuk memberikan peningkatan kejelasan seputar penyebab dan langkah berikutnya. Hasilnya berisi properti berikut:

Properti Deskripsi Contoh
Kunci ID dokumen dari dokumen yang terkena dampak kesalahan atau peringatan. https://<storageaccount>.blob.core.windows.net/jfk-1k/docid-32112954.pdf
Nama Nama operasi yang menjelaskan di mana terjadi kesalahan atau peringatan. Ini dihasilkan oleh struktur berikut: [category].[subcategory].[resourceType]. .[resourceName] DocumentExtraction.azureblob.myBlobContainerName Enrichment.WebApiSkill.mySkillName Projection.SearchIndex.OutputFieldMapping.myOutputFieldName Projection.SearchIndex.MergeOrUpload.myIndexName Projection.KnowledgeStore.Table.myTableName
Pesan Deskripsi tingkat tinggi tentang kesalahan atau peringatan. Could not execute skill because the Web Api request failed.
Detail Informasi spesifik yang mungkin berguna dalam mendiagnosis masalah, seperti respons WebApi jika menjalankan keterampilan kustom gagal. link-cryptonyms-list - Error processing the request record : System.ArgumentNullException: Value cannot be null. Parameter name: source at System.Linq.Enumerable.All[TSource](IEnumerable 1 source, Func 2 predicate) at Microsoft.CognitiveSearch.WebApiSkills.JfkWebApiSkills. ...rest of stack trace...
DocumentationLink Tautan ke dokumentasi yang relevan dengan informasi terperinci untuk men-debug dan menyelesaikan masalah. Tautan ini akan sering menunjuk ke salah satu bagian di bawah ini di halaman ini. https://go.microsoft.com/fwlink/?linkid=2106475

Error: Could not read document

Pengindeks tidak bisa membaca dokumen dari sumber data. Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Jenis bidang yang tidak konsisten di seluruh dokumen yang berbeda Type of value has a mismatch with column type. Couldn't store '{47.6,-122.1}' in authors column. Expected type is JArray. Error converting data type nvarchar to float. Conversion failed when converting the nvarchar value '12 months' to data type int. Arithmetic overflow error converting expression to data type int. Pastikan bahwa jenis setiap bidang sama di seluruh dokumen yang berbeda. Misalnya, jika bidang dokumen 'startTime' pertama adalah DateTime, dan di dokumen kedua itu adalah string, kesalahan ini ditemui.
Kesalahan dari layanan yang mendasar sumber data Dari Azure Cosmos DB: {"Errors":["Request rate is large"]} Periksa instans penyimpanan Anda untuk memastikan instans tersebut sehat. Anda mungkin perlu menyesuaikan penskalaan atau partisi Anda.
Masalah sementara A transport-level error has occurred when receiving results from the server. (provider: TCP Provider, error: 0 - An existing connection was forcibly closed by the remote host Kadang-kadang ada masalah konektivitas yang tidak terduga. Coba jalankan kembali dokumen melalui pengindeks Anda nanti.

Error: Could not extract content or metadata from your document

Pengindeks dengan sumber data Blob tidak dapat mengekstrak konten atau metadata dari dokumen (misalnya, file PDF). Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Blob melebihi batas ukuran Document is '150441598' bytes, which exceeds the maximum size '134217728' bytes for document extraction for your current service tier. Kesalahan pengindeksan blob
Blob memiliki tipe isi yang tidak didukung Document has unsupported content type 'image/png' Kesalahan pengindeksan blob
Blob dienkripsi Document could not be processed - it may be encrypted or password protected. Anda dapat melewati blob dengan pengaturan blob.
Masalah sementara Error processing blob: The request was aborted: The request was canceled. Document timed out during processing. Kadang-kadang ada masalah konektivitas yang tidak terduga. Coba jalankan kembali dokumen melalui pengindeks Anda nanti.

Error: Could not parse document

Pengindeks membaca dokumen dari sumber data, tetapi ada masalah yang mengonversi konten dokumen menjadi skema pemetaan bidang yang ditentukan. Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Kunci dokumen hilang Document key cannot be missing or empty Pastikan semua dokumen memiliki kunci dokumen yang valid. Kunci dokumen ditentukan dengan mengatur properti 'kunci' sebagai bagian dari definisi indeks. Pengindeks mengeluarkan kesalahan ini ketika properti yang ditandai sebagai 'kunci' tidak dapat ditemukan pada dokumen tertentu.
Kunci dokumen tidak valid Invalid document key. Keys can only contain letters, digits, underscore (_), dash (-), or equal sign (=). Pastikan semua dokumen memiliki kunci dokumen yang valid. Tinjau Pengindeksan Blob Storage untuk detail selengkapnya. Jika Anda menggunakan pengindeks blob, dan kunci dokumen Anda adalah metadata_storage_path bidang , pastikan definisi pengindeks memiliki fungsi pemetaan base64Encode dengan sama nulldengan parameters , bukan jalur dalam teks biasa.
Kunci dokumen tidak valid Document key cannot be longer than 1024 characters Ubah kunci dokumen untuk memenuhi persyaratan validasi.
Tidak dapat menerapkan pemetaan bidang ke bidang Could not apply mapping function 'functionName' to field 'fieldName'. Array cannot be null. Parameter name: bytes Periksa kembali pemetaan bidang yang ditentukan pada pengindeks, dan bandingkan dengan data bidang yang ditentukan dari dokumen yang gagal. Mungkin perlu untuk mengubah pemetaan bidang atau data dokumen.
Tidak dapat membaca nilai bidang Could not read the value of column 'fieldName' at index 'fieldIndex'. A transport-level error has occurred when receiving results from the server. (provider: TCP Provider, error: 0 - An existing connection was forcibly closed by the remote host.) Kesalahan ini biasanya disebabkan oleh masalah konektivitas yang tidak terduga dengan layanan yang mendasari sumber data. Coba jalankan kembali dokumen melalui pengindeks Anda nanti.

Error: Could not map output field 'xyz' to search index due to deserialization problem while applying mapping function 'abc'

Pemetaan output mungkin gagal karena data output dalam format yang salah untuk fungsi pemetaan yang Anda gunakan. Misalnya, menerapkan Base64Encode fungsi pemetaan pada data biner akan menghasilkan kesalahan ini. Untuk mengatasi masalah ini, jalankan ulang pengindeks tanpa menentukan fungsi pemetaan atau pastikan bahwa fungsi pemetaan kompatibel dengan jenis data bidang output. Lihat Pemetaan bidang output untuk detailnya.

Error: Could not execute skill

Pengindeks tidak dapat menjalankan keterampilan dalam set keterampilan.

Alasan Detail/Contoh Resolusi
Masalah konektivitas sementara Timbul kesalahan sementara. Coba lagi nanti. Kadang-kadang ada masalah konektivitas yang tidak terduga. Coba jalankan kembali dokumen melalui pengindeks Anda nanti.
Bug produk potensial Terjadi kesalahan tidak terduga. Ini menunjukkan kelas kegagalan yang tidak diketahui dan dapat menunjukkan bug produk. Ajukan tiket dukungan untuk mendapatkan bantuan.
Keterampilan telah mengalami kesalahan selama eksekusi (Dari Kemampuan Penggabungan) Satu atau beberapa nilai offset tidak valid dan tidak dapat diurai. Item disisipkan di akhir teks Gunakan informasi dalam pesan kesalahan untuk memperbaiki masalah. Kegagalan semacam ini memerlukan tindakan untuk mengatasinya.

Error: Could not execute skill because the Web API request failed

Eksekusi keterampilan gagal karena panggilan ke API Web gagal. Biasanya, kelas kegagalan ini terjadi ketika keterampilan kustom digunakan, dalam hal ini Anda perlu men-debug kode kustom Anda untuk menyelesaikan masalah. Jika kegagalan berasal dari keterampilan bawaan, lihat pesan kesalahan untuk bantuan dalam memperbaiki masalah.

Saat men-debug masalah ini, pastikan untuk memperhatikan setiap peringatan input keterampilan untuk keterampilan ini. Titik akhir API Web Anda mungkin gagal karena pengindeks meneruskannya masukan tak terduga.

Error: Could not execute skill because Web API skill response is invalid

Eksekusi keterampilan gagal karena panggilan ke API Web mengembalikan respons yang tidak valid. Biasanya, kelas kegagalan ini terjadi ketika keterampilan kustom digunakan, dalam hal ini Anda perlu men-debug kode kustom Anda untuk menyelesaikan masalah. Jika kegagalan berasal dari keterampilan bawaan, ajukan tiket dukungan untuk mendapatkan bantuan.

Error: Type of value has a mismatch with column type. Couldn't store in 'xyz' column. Expected type is 'abc'

Jika sumber data Anda memiliki bidang dengan tipe data yang berbeda dari bidang yang coba Anda petakan dalam indeks, Anda mungkin mengalami kesalahan ini. Periksa jenis data bidang sumber data Anda dan pastikan data tersebut dipetakan dengan benar ke jenis data indeks Anda.

Error: Skill did not execute within the time limit

Ada dua kasus di mana Anda mungkin mengalami pesan kesalahan ini, yang masing-masing harus diperlakukan secara berbeda. Ikuti petunjuk di bawah ini tergantung pada keterampilan apa yang mengembalikan kesalahan ini untuk Anda.

Keterampilan layanan Azure AI bawaan

Banyak keterampilan kognitif bawaan, seperti deteksi bahasa, pengenalan entitas, atau OCR, didukung oleh titik akhir API layanan Azure AI. Terkadang ada masalah sementara dengan titik akhir ini dan permintaan akan kehabisan waktu. Untuk masalah sementara, tidak ada obat kecuali menunggu dan mencoba lagi. Sebagai mitigasi, pertimbangkan untuk mengatur pengindeks Anda agar berjalan sesuai jadwal. Pengindeksan terjadwal mengambil tempat yang ditinggalkannya. Dengan asumsi masalah sementara diselesaikan, pengindeksan dan pemrosesan keterampilan kognitif harus dapat dilanjutkan pada jangka waktu terjadwal berikutnya.

Jika Anda terus melihat kesalahan ini pada dokumen yang sama untuk keterampilan kognitif bawaan, ajukan tiket dukungan untuk mendapatkan bantuan, karena ini tidak diharapkan.

Keterampilan kustom

Jika Anda mengalami kesalahan waktu habis dengan keterampilan kustom, ada beberapa hal yang dapat Anda coba. Pertama, tinjau keterampilan kustom Anda dan pastikan bahwa keterampilan tersebut tidak terjebak dalam perulangan tak terbatas dan mengembalikan hasil secara konsisten. Setelah Anda mengonfirmasi bahwa hasil dikembalikan, periksa durasi eksekusi. Jika Anda tidak secara eksplisit menetapkan timeout nilai pada definisi keterampilan kustom Anda, maka defaultnya timeout adalah 30 detik. Jika 30 detik tidak cukup lama untuk dijalankan keterampilan Anda, Anda dapat menentukan nilai yang lebih tinggi timeout pada definisi keterampilan kustom Anda. Berikut adalah contoh definisi keterampilan kustom di mana batas waktu diatur ke 90 detik:

  {
        "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
        "uri": "<your custom skill uri>",
        "batchSize": 1,
        "timeout": "PT90S",
        "context": "/document",
        "inputs": [
          {
            "name": "input",
            "source": "/document/content"
          }
        ],
        "outputs": [
          {
            "name": "output",
            "targetName": "output"
          }
        ]
      }

Nilai maksimum yang dapat Anda tetapkan untuk timeout parameter adalah 230 detik. Jika keterampilan kustom Anda tidak dapat dijalankan secara konsisten dalam waktu 230 detik, Anda mungkin mempertimbangkan untuk mengurangi batchSize keterampilan kustom Anda sehingga memiliki lebih sedikit dokumen untuk diproses dalam satu eksekusi. Jika Anda telah mengatur batchSize ke 1, Anda perlu menulis ulang keterampilan untuk dapat mengeksekusi dalam waktu kurang dari 230 detik, atau membaginya menjadi beberapa keterampilan kustom sehingga waktu eksekusi untuk keterampilan kustom tunggal adalah maksimum 230 detik. Ulas dokumentasi keterampilan kustom untuk informasi lebih lanjut.

Error: Could not 'MergeOrUpload' | 'Delete' document to the search index

Dokumen dibaca dan diproses, tetapi pengindeks tidak dapat menambahkannya ke indeks pencarian. Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Bidang berisi istilah yang terlalu besar Istilah dalam dokumen Anda lebih besar dari batas 32 KB Anda dapat menghindari pembatasan ini dengan memastikan bidang tidak dikonfigurasi sebagai dapat difilter, dapat difaset, atau dapat diurutkan.
Dokumen terlalu besar untuk diindeks Dokumen lebih besar dari ukuran permintaan API maksimum Cara mengindeks himpunann data besar
Dokumen berisi terlalu banyak objek dalam koleksi Koleksi dalam dokumen Anda melebihi elemen maksimum di semua batas koleksi kompleks. The document with key '1000052' has '4303' objects in collections (JSON arrays). At most '3000' objects are allowed to be in collections across the entire document. Remove objects from collections and try indexing the document again. Sebaiknya kurangi ukuran koleksi kompleks dalam dokumen hingga di bawah batas dan hindari pemanfaatan penyimpanan yang tinggi.
Masalah saat menyambungkan ke indeks target (yang berlanjut setelah dicoba kembali) karena layanan berada di bawah beban lain, seperti kueri atau pengindeksan. Gagal membuat sambungan untuk memutakhirkan indeks. Layanan pencarian berada di bawah beban berat. Tingkatkan layanan pencarian Anda
Layanan pencarian sedang ditambal untuk pembaruan layanan, atau berada di tengah-tengah konfigurasi ulang topologi. Gagal membuat sambungan untuk memutakhirkan indeks. Layanan pencarian saat ini sedang down/layanan Pencarian sedang mengalami transisi. Mengonfigurasi layanan dengan setidaknya tiga replika untuk ketersediaan 99,9% per dokumentasi SLA
Kegagalan dalam sumber daya komputasi/jaringan yang mendasarinya (jarang) Gagal membuat sambungan untuk memutakhirkan indeks. Terjadi kegagalan yang tidak diketahui. Konfigurasikan pengindeks untuk berjalan pada jadwal untuk mengambil dari status gagal.
Permintaan pengindeksan yang dibuat ke indeks target tidak diakui dalam periode batas waktu karena masalah jaringan. Tidak bisa membuat sambungan ke indeks pencarian secara tepat waktu. Konfigurasikan pengindeks untuk berjalan pada jadwal untuk mengambil dari status gagal. Selain itu, coba turunkan ukuran batch pengindeks jika kondisi galat ini tetap ada.

Error: Could not index document because some of the document's data was not valid

Dokumen dibaca dan diproses oleh pengindeks, tetapi karena ketidakcocokan dalam konfigurasi bidang indeks dan data yang diekstrak dan diproses oleh pengindeks, tidak dapat ditambahkan ke indeks pencarian. Hal ini dapat terjadi karena:

Alasan Detail/Contoh
Jenis data dari satu atau beberapa bidang yang diekstrak oleh pengindeks tidak kompatibel dengan model data bidang indeks target yang sesuai. The data field '_data_' in the document with key '888' has an invalid value 'of type 'Edm.String''. The expected type was 'Collection(Edm.String)'.
Gagal mengekstrak entitas JSON dari nilai string. Could not parse value 'of type 'Edm.String'' of field '_data_' as a JSON object. Error:'After parsing a value an unexpected character was encountered: ''. Path '_path_', line 1, position 3162.'
Gagal mengekstrak koleksi entitas JSON dari nilai string. Could not parse value 'of type 'Edm.String'' of field '_data_' as a JSON array. Error:'After parsing a value an unexpected character was encountered: ''. Path '[0]', line 1, position 27.'
Jenis tak dikenal ditemukan di dokumen sumber. Unknown type '_unknown_' cannot be indexed
Notasi yang tidak kompatibel untuk titik geografi digunakan dalam dokumen sumber. WKT POINT string literals are not supported. Use GeoJson point literals instead

Dalam semua kasus ini, lihat Jenis data yang Didukung dan Peta jenis data untuk pengindeks untuk memastikan bahwa Anda menyusun skema indeks dengan benar dan telah menyiapkan pemetaan bidang pengindeks yang sesuai. Pesan kesalahan menyertakan detail yang dapat membantu melacak sumber ketidakcocokan.

Error: Integrated change tracking policy cannot be used because table has a composite primary key

Ini berlaku untuk tabel SQL, dan biasanya terjadi ketika kunci ditentukan sebagai kunci komposit atau, ketika tabel telah menentukan indeks berkluster unik (seperti dalam indeks SQL, bukan indeks Pencarian Azure). Alasan utamanya adalah bahwa atribut kunci dimodifikasi menjadi kunci primer komposit dalam indeks berkluster yang unik. Dalam hal ini, pastikan tabel SQL Anda tidak memiliki indeks berkluster yang unik, atau Anda memetakan bidang kunci ke bidang yang dijamin tidak memiliki nilai duplikat.

Error: Could not process document within indexer max run time

Kesalahan ini terjadi ketika pengindeks tidak dapat menyelesaikan pemrosesan satu dokumen dari sumber data dalam waktu eksekusi yang diizinkan. Waktu berlari maksimum lebih singkat ketika keterampilan digunakan. Ketika kesalahan ini terjadi, jika Anda memiliki maxFailedItems yang diatur ke nilai selain 0, pengindeks melewati dokumen pada masa mendatang sehingga pengindeksan dapat maju. Jika Anda tidak mampu melewati dokumen apa pun, atau jika Anda melihat kesalahan ini secara konsisten, pertimbangkan untuk memecah dokumen menjadi dokumen yang lebih kecil sehingga kemajuan parsial dapat dilakukan dalam satu eksekusi pengindeks.

Error: Could not project document

Kesalahan ini terjadi ketika pengindeks mencoba memproyeksikan data ke penyimpanan pengetahuan dan ada kegagalan pada upaya tersebut. Kegagalan ini bisa konsisten dan dapat diperbaiki, atau bisa menjadi kegagalan sementara dengan sink output proyeksi yang mungkin perlu Anda tunggu dan coba lagi untuk menyelesaikannya. Berikut adalah serangkaian status kegagalan yang diketahui dan kemungkinan resolusi.

Alasan Detail/Contoh Resolusi
Tidak bisa memutakhirkan blob proyeksi 'blobUri' dalam kontainer 'containerName' Kontainer yang ditentukan tidak ada. Pengindeks memeriksa apakah kontainer yang ditentukan telah dibuat sebelumnya dan akan membuatnya jika perlu, tetapi hanya melakukan pemeriksaan ini sekali per pengindeks berjalan. Kesalahan ini berarti bahwa sesuatu menghapus kontainer setelah langkah ini. Untuk mengatasi kesalahan ini, cobalah ini: biarkan informasi akun penyimpanan Anda saja, tunggu hingga pengindeks selesai, lalu jalankan ulang pengindeks.
Tidak bisa memutakhirkan blob proyeksi 'blobUri' dalam kontainer 'containerName' Tidak dapat menulis data dari koneksi transportasi: Koneksi yang ada ditutup secara paksa oleh host jarak jauh. Ini diharapkan menjadi kegagalan sementara dengan Microsoft Azure Storage dan dengan demikian harus diselesaikan dengan menjalankan ulang pengindeks. Jika Anda mengalami kesalahan ini secara konsisten, ajukan tiket dukungan sehingga dapat diselidiki lebih lanjut.
Tidak bisa memperbarui baris 'projectionRow' dalam tabel 'tableName' Server sibuk. Ini diharapkan menjadi kegagalan sementara dengan Microsoft Azure Storage dan dengan demikian harus diselesaikan dengan menjalankan ulang pengindeks. Jika Anda mengalami kesalahan ini secara konsisten, ajukan tiket dukungan sehingga dapat diselidiki lebih lanjut.

Error: The cognitive service for skill '<skill-name>' has been throttled

Eksekusi keterampilan gagal karena panggilan ke layanan Azure AI dibatasi. Biasanya, kelas kegagalan ini terjadi ketika terlalu banyak keterampilan yang dijalankan secara paralel. Jika Anda menggunakan pustaka klien Microsoft.Search.Documents untuk menjalankan pengindeks, Anda bisa menggunakan SearchIndexingBufferedSender untuk mendapatkan coba lagi otomatis pada langkah-langkah yang gagal. Jika tidak, Anda dapat mengatur ulang dan menjalankan ulang pengindeks.

Error: Expected IndexAction metadata

Kesalahan 'Metadata IndexAction yang Diharapkan' berarti ketika pengindeks mencoba membaca dokumen untuk mengidentifikasi tindakan apa yang harus diambil, itu tidak menemukan metadata yang sesuai pada dokumen. Biasanya, kesalahan ini terjadi ketika pengindeks memiliki cache anotasi yang ditambahkan atau dihapus tanpa mengatur ulang pengindeks. Untuk mengatasi hal ini, Anda harus mengatur ulang dan menjalankan ulang pengindeks.

Warning: Skill input was invalid

Input ke keterampilan hilang, memiliki jenis yang salah, atau sebaliknya, tidak valid. Anda mungkin melihat informasi berikut:

  • Could not execute skill

  • Skill executed but may have unexpected results

Keterampilan kognitif telah membutuhkan input dan input opsional. Misalnya, keterampilan ekstraksi Frasa kunci memiliki dua input textyang diperlukan , languageCode, dan tidak ada input opsional. Input keterampilan kustom semuanya dianggap sebagai input opsional.

Jika input yang diperlukan hilang atau jika input bukan jenis yang tepat, keterampilan akan dilewati dan menghasilkan peringatan. Keterampilan yang dilewati tidak menghasilkan output. Jika keterampilan hilir mengonsumsi output keterampilan yang dilewati, mereka dapat menghasilkan peringatan lain.

Jika input opsional hilang, keterampilan masih berjalan, tetapi mungkin menghasilkan output yang tidak terduga karena input yang hilang.

Dalam kedua kasus, peringatan ini disebabkan oleh bentuk data Anda. Misalnya, jika Anda memiliki dokumen yang berisi informasi tentang orang dengan bidang firstName, , middleNamedan lastName, Anda mungkin memiliki beberapa dokumen yang tidak memiliki entri untuk middleName. Jika Anda meneruskan middleName sebagai input ke keterampilan dalam alur, maka diharapkan input keterampilan ini kehilangan beberapa waktu. Anda perlu mengevaluasi data dan skenario Anda untuk menentukan apakah tindakan apa pun diperlukan sebagai akibat dari peringatan ini atau tidak.

Jika Anda ingin memberikan nilai default untuk input yang hilang, Anda dapat menggunakan keterampilan Bersyarah untuk menghasilkan nilai default lalu menggunakan output keterampilan Bersyarkat sebagai input keterampilan.

{
    "@odata.type": "#Microsoft.Skills.Util.ConditionalSkill",
    "context": "/document",
    "inputs": [
        { "name": "condition", "source": "= $(/document/language) == null" },
        { "name": "whenTrue", "source": "= 'en'" },
        { "name": "whenFalse", "source": "= $(/document/language)" }
    ],
    "outputs": [ { "name": "output", "targetName": "languageWithDefault" } ]
}
Alasan Detail/Contoh Resolusi
Input keterampilan adalah jenis yang salah "Input keterampilan yang diperlukan bukan dari jenis yang diharapkan String. Nama: text, Sumber: /document/merged_content." "Input keterampilan yang diperlukan bukan dari format yang diharapkan. Nama: text, Sumber: /document/merged_content." "Tidak dapat melakukan iterasi melalui non-array /document/normalized_images/0/imageCelebrities/0/detail/celebrities." "Tidak dapat memilih 0 di non-array /document/normalized_images/0/imageCelebrities/0/detail/celebrities" Keterampilan tertentu mengharapkan input dari jenis tertentu, misalnya Keterampilan sentimen mengharapkan text menjadi string. Jika input menentukan nilai nonstring, maka keterampilan tidak dijalankan dan tidak menghasilkan output. Pastikan himpunan data Anda memiliki nilai input yang seragam, atau gunakan keterampilan Custom Web API untuk melakukan praproses input. Jika Anda iterasi keterampilan atas array, periksa konteks keterampilan dan input yang ada * di posisi yang benar. Biasanya baik konteks dan sumber input harus diakhiri * dengan untuk array.
Input keterampilan hilang Required skill input is missing. Name: text, Source: /document/merged_content Missing value /document/normalized_images/0/imageTags. Unable to select 0 in array /document/pages of length 0. Jika peringatan ini terjadi untuk semua dokumen, mungkin ada kesalahan ketik di jalur input. Periksa casing nama properti. Periksa tambahan atau hilang * di jalur. Verifikasi bahwa dokumen dari sumber data menyediakan input yang diperlukan.
Input kode bahasa keterampilan tidak valid Input keterampilan languageCode memiliki kode bahasa berikutX,Y,Z, setidaknya salah satunya tidak valid. Lihat lebih detail di bawah ini.

Warning: Skill input 'languageCode' has the following language codes 'X,Y,Z', at least one of which is invalid.

Satu atau beberapa nilai yang diteruskan ke input opsional languageCode keterampilan hilir tidak didukung. Ini dapat terjadi jika Anda meneruskan output LanguageDetectionSkill ke keterampilan berikutnya, dan output terdiri dari lebih banyak bahasa daripada yang didukung dalam keterampilan hilir tersebut.

Perhatikan bahwa Anda juga bisa mendapatkan peringatan yang mirip dengan ini jika input yang tidak valid countryHint diteruskan ke LanguageDetectionSkill. Jika itu terjadi, validasi bahwa bidang yang Anda gunakan dari sumber data untuk input tersebut berisi kode negara dua huruf ISO 3166-1 alpha-2 yang valid. Jika beberapa valid dan beberapa tidak valid, lanjutkan dengan panduan berikut tetapi ganti languageCode dengan countryHint dan defaultLanguageCode dengan defaultCountryHint untuk mencocokkan kasus penggunaan Anda.

Jika Anda tahu bahwa himpunan data Anda semuanya dalam satu bahasa, Anda harus menghapus LanguageDetectionSkill dan languageCode input keterampilan dan menggunakan defaultLanguageCode parameter keterampilan untuk keterampilan itu sebagai gantinya, dengan asumsi bahasa komputer didukung untuk keterampilan itu.

Jika Anda tahu bahwa himpunan data Anda berisi beberapa bahasa dan dengan demikian Anda memerlukan LanguageDetectionSkill dan languageCode input, pertimbangkan untuk menambahkan ConditionalSkill untuk memfilter teks dengan bahasa yang tidak didukung sebelum meneruskan teks ke keterampilan hilir. Berikut adalah contoh tampilannya untuk EntityRecognitionSkill:

{
    "@odata.type": "#Microsoft.Skills.Util.ConditionalSkill",
    "context": "/document",
    "inputs": [
        { "name": "condition", "source": "= $(/document/language) == 'de' || $(/document/language) == 'en' || $(/document/language) == 'es' || $(/document/language) == 'fr' || $(/document/language) == 'it'" },
        { "name": "whenTrue", "source": "/document/content" },
        { "name": "whenFalse", "source": "= null" }
    ],
    "outputs": [ { "name": "output", "targetName": "supportedByEntityRecognitionSkill" } ]
}

Berikut adalah beberapa referensi untuk bahasa yang saat ini didukung untuk setiap keterampilan yang dapat menghasilkan pesan kesalahan ini:

Warning: Skill input was truncated

Keterampilan kognitif membatasi panjang teks yang dapat dianalisis pada satu waktu. Jika input teks melebihi batas, teks dipotong sebelum diperkaya. Keterampilan dijalankan, tetapi tidak melalui semua data Anda.

Dalam contoh LanguageDetectionSkill di bawah ini, 'text' bidang input mungkin memicu peringatan ini jika input melebihi batas karakter. Batas input dapat ditemukan dalam dokumentasi referensi keterampilan.

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [...]
  }

Jika Anda ingin memastikan bahwa semua teks dianalisis, pertimbangkan untuk menggunakan keterampilan Split.

Warning: Web API skill response contains warnings

Pengindeks menjalankan keterampilan dalam set keterampilan, tetapi respons dari permintaan API Web menunjukkan ada peringatan. Tinjau peringatan untuk memahami dampak data Anda dan apakah tindakan lebih lanjut diperlukan.

Warning: The current indexer configuration does not support incremental progress

Peringatan ini hanya terjadi untuk sumber data Azure Cosmos DB.

Perkembangan inkremental selama pengindeksan memastikan bahwa jika eksekusi pengindeks terganggu oleh kegagalan sementara atau batas waktu eksekusi, pengindeks dapat melanjutkan dari tempat terakhir yang ia tinggalkan saat kembali berjalan, dan tidak harus mengindeks ulang seluruh koleksi dari awal. Hal ini sangat penting ketika mengindeks kumpulan berukuran besar.

Kemampuan untuk melanjutkan pekerjaan pengindeksan yang belum selesai berpredikat pada dokumen yang dipesan oleh _ts kolom. Pengindeks menggunakan tanda waktu untuk menentukan dokumen mana yang akan dijemput berikutnya. Jika _ts kolom hilang atau jika pengindeks tidak dapat menentukan apakah kueri kustom diurutkan olehnya, pengindeks dimulai dari awal dan Anda akan melihat peringatan ini.

Dimungkinkan untuk mengambil alih perilaku ini, memungkinkan kemajuan bertambah bertahap dan menekan peringatan ini dengan menggunakan assumeOrderByHighWaterMarkColumn properti konfigurasi.

Untuk informasi selengkapnya, lihat Kemajuan tahapan dan kueri kustom.

Warning: Some data was lost during projection. Row 'X' in table 'Y' has string property 'Z' which was too long.

Layanan Table Storage memiliki batasan tentang seberapa besar properti entitas. String dapat memiliki 32.000 karakter atau lebih sedikit. Jika baris dengan properti string yang lebih panjang dari 32.000 karakter sedang diproyeksikan, hanya 32.000 karakter pertama yang dipertahankan. Untuk mengatasi masalah ini, hindari memproyeksikan baris dengan properti string lebih dari 32.000 karakter.

Warning: Truncated extracted text to X characters

Pengindeks membatasi berapa banyak teks yang dapat diekstraksi dari satu dokumen. Batas ini tergantung pada tingkat harga: 32.000 karakter untuk tingkat Gratis, 64.000 untuk Dasar, 4 juta untuk Standar, 8 juta untuk S2 Standar, dan 16 juta untuk S3 Standar. Teks yang dipotong tidak akan diindeks. Untuk menghindari peringatan ini, cobalah memecah dokumen dengan sejumlah besar teks menjadi beberapa dokumen yang lebih kecil.

Untuk informasi selengkapnya, lihatBatas pengindeks.

Warning: Could not map output field 'X' to search index

Pemetaan bidang output yang mereferensikan data yang tidak ada/null akan menghasilkan peringatan untuk setiap dokumen dan menghasilkan bidang indeks kosong. Untuk mengatasi masalah ini, periksa kembali jalur sumber pemetaan bidang output Anda untuk kemungkinan kesalahan ketik, atau atur nilai default menggunakan keterampilan Bersyarah. Lihat Pemetaan bidang output untuk detailnya.

Alasan Detail/Contoh Resolusi
Tidak dapat iterasi atas non-array "Tidak dapat iterasi atas non-array /document/normalized_images/0/imageCelebrities/0/detail/celebrities." Kesalahan ini terjadi ketika output bukan array. Jika Menurut Anda output harus merupakan array, periksa jalur bidang sumber output yang ditunjukkan untuk kesalahan. Misalnya, Anda mungkin memiliki sesuatu yang hilang atau lebih * dalam nama bidang sumber. Ada kemungkinan juga bahwa input ke keterampilan ini null, menghasilkan array kosong. Cari detail serupa di bagian Input keterampilantidak valid.
Tidak dapat memilih 0 dalam non-array "Tidak dapat memilih 0 dalam non-array /document/pages." Ini bisa terjadi jika output keterampilan tidak menghasilkan array dan nama bidang sumber output memiliki indeks array atau * di jalurnya. Periksa kembali jalur yang disediakan dalam nama bidang sumber output dan nilai bidang untuk nama bidang yang ditunjukkan. Cari detail serupa di bagian Input keterampilantidak valid.

Warning: The data change detection policy is configured to use key column 'X'

Kebijakan deteksi perubahan data memiliki persyaratan khusus untuk kolom yang digunakan untuk mendeteksi perubahan. Salah satu persyaratan ini adalah bahwa kolom ini diperbarui setiap kali item sumber diubah. Persyaratan lain adalah bahwa nilai baru untuk kolom ini lebih besar dari nilai sebelumnya. Kolom kunci tidak memenuhi persyaratan ini karena tidak berubah pada setiap pembaruan. Untuk mengatasi masalah ini, pilih kolom lain untuk kebijakan deteksi perubahan.

Warning: Document text appears to be UTF-16 encoded, but is missing a byte order mark

Mode penguraian pengindeks perlu mengetahui bagaimana teks dikodekan sebelum menguraikannya. Dua cara paling umum untuk mengkodekan teks adalah UTF-16 dan UTF-8. UTF-8 adalah pengkodean panjang variabel dengan masing-masing karakter memiliki panjang antara 1 byte dan 4 byte. UTF-16 adalah pengkodean panjang tetap dengan masing-masing karakter memiliki panjang 2 byte. UTF-16 memiliki dua varian yang berbeda, big endian dan little endian. Pengodean teks ditentukan oleh byte order mark, serangkaian byte sebelum teks.

Pengodean Tanda Pesanan Byte
UTF-16 Big Endian 0xFE 0xFF
UTF-16 Little Endian 0xFF 0xFE
UTF-8 0xEF 0xBB 0xBF

Jika tidak ada tanda pesanan byte yang ada, teks diasumsikan dikodekan sebagai UTF-8.

Untuk mengerjakan peringatan ini, tentukan apa pengkodean teks untuk blob ini dan tambahkan tanda pesanan byte yang sesuai.

Warning: Azure Cosmos DB collection 'X' has a Lazy indexing policy. Some data may be lost

Koleksi dengan kebijakan pengindeksan Malas tidak dapat dikueri secara konsisten, sehingga data pengindeks Anda hilang. Untuk mengerjakan peringatan ini, ubah kebijakan pengindeksan Anda menjadi Konsisten.

Warning: The document contains very long words (longer than 64 characters). These words may result in truncated and/or unreliable model predictions.

Peringatan ini diteruskan dari layanan Bahasa layanan Azure AI. Dalam beberapa kasus, aman untuk mengabaikan peringatan ini, misalnya jika string panjang hanyalah URL panjang. Ketahuilah bahwa ketika kata lebih panjang dari 64 karakter, kata 'dipotong menjadi 64 karakter yang dapat memengaruhi prediksi model.

Error: Cannot write more bytes to the buffer than the configured maximum buffer size

Pengindeks memiliki batas ukuran dokumen. Pastikan bahwa dokumen di sumber data Anda lebih kecil dari batas ukuran yang didukung, seperti yang didokumenkan untuk tingkat layanan Anda.