Bagikan melalui


Pemecahan masalah kesalahan dan peringatan pengindeks umum di Azure AI Search

Artikel ini menyediakan informasi dan solusi untuk kesalahan umum dan peringatan yang mungkin Anda temui selama pengindeksan dan pengayaan AI di Azure AI Search.

Pengindeksan berhenti ketika jumlah kesalahan melebihi 'maxFailedItems'.

Jika Anda ingin pengindeks mengabaikan kesalahan ini (dan melewati "dokumen yang gagal"), pertimbangkan untuk memperbarui maxFailedItems dan maxFailedItemsPerBatch seperti yang dijelaskan di sini.

Nota

Setiap dokumen yang gagal bersama dengan kunci dokumennya (jika tersedia) akan muncul sebagai kesalahan dalam status eksekusi pengindeks. Anda dapat menggunakan api indeks untuk mengunggah dokumen secara manual di titik selanjutnya jika Anda telah mengatur pengindeks untuk mentolerir kegagalan.

Informasi kesalahan dalam artikel ini dapat membantu Anda mengatasi kesalahan, memungkinkan pengindeksan berlanjut.

Peringatan tidak menghentikan pengindeksan, tetapi menunjukkan kondisi yang dapat mengakibatkan hasil yang tidak terduga. Apakah Anda mengambil tindakan atau tidak tergantung pada data dan skenario Anda.

Di mana Anda dapat menemukan kesalahan pengindeks tertentu?

Untuk memverifikasi status pengindeks dan mengidentifikasi kesalahan di portal Microsoft Azure, ikuti langkah-langkah di bawah ini:

  1. Masuk ke portal Azure dan temukan layanan pencarian Anda.

  2. Di sebelah kiri, perluasPengindeksManajemen> Pencarian dan pilih pengindeks.

  3. Di bawah Riwayat Eksekusi, pilih status. Semua status, termasuk keberhasilan, memiliki detail tentang pelaksanaan.

  4. Jika ada kesalahan, arahkan mouse ke atas pesan kesalahan. Panel muncul di sisi kanan layar Anda yang menampilkan informasi terperinci tentang kesalahan tersebut.

Kesalahan sementara

Untuk berbagai alasan, seperti gangguan komunikasi jaringan sementara, batas waktu untuk proses yang berlangsung lama, atau keunikan dokumen tertentu, biasanya ada kesalahan atau peringatan sementara selama proses pengindeksan. Namun, kesalahan ini bersifat sementara dan harus diselesaikan dalam eksekusi pengindeks berikutnya.

Untuk mengelola kesalahan ini secara efektif, sebaiknya letakkan pengindeks Anda pada jadwal, misalnya, untuk berjalan setiap lima menit, di mana eksekusi berikutnya dimulai lima menit setelah menyelesaikan eksekusi pertama, mematuhi batas runtime maksimum pada layanan Anda. Eksekusi yang dijadwalkan secara teratur membantu memperbaiki kesalahan atau peringatan sementara.

Jika kesalahan berlanjut selama beberapa kali pengindeksan, kemungkinan besar itu bukan masalah sementara. Dalam kasus seperti itu, lihat daftar di bawah ini untuk solusi potensial.

Properti kesalahan

Harta benda Deskripsi Contoh
Kunci ID dari dokumen yang terpengaruh oleh kesalahan atau peringatan. Contoh Azure Storage, di mana ID default adalah jalur penyimpanan metadata: https://<storageaccount>.blob.core.windows.net/jfk-1k/docid-32112954.pdf
Nama Operasi yang menyebabkan kesalahan atau peringatan. Ini dihasilkan oleh struktur berikut: [category].[subcategory].[resourceType]. .[resourceName] DocumentExtraction.azureblob.myBlobContainerName Enrichment.WebApiSkill.mySkillName Projection.SearchIndex.OutputFieldMapping.myOutputFieldName Projection.SearchIndex.MergeOrUpload.myIndexName Projection.KnowledgeStore.Table.myTableName
Pesan Deskripsi tingkat tinggi tentang kesalahan atau peringatan. Could not execute skill because the Web Api request failed.
Detail lebih lanjut Informasi spesifik yang mungkin berguna dalam mendiagnosis masalah, seperti respons WebApi jika eksekusi kemampuan kustom gagal. link-cryptonyms-list - Error processing the request record : System.ArgumentNullException: Value cannot be null. Parameter name: source at System.Linq.Enumerable.All[TSource](IEnumerable 1 source, Func 2 predicate) at Microsoft.CognitiveSearch.WebApiSkills.JfkWebApiSkills. ...rest of stack trace...
DocumentationLink Tautan ke dokumentasi yang relevan dengan informasi terperinci untuk men-debug dan menyelesaikan masalah. Tautan ini akan sering menunjuk ke salah satu bagian di bawah ini di halaman ini. https://go.microsoft.com/fwlink/?linkid=2106475

Error: Could not read document

Pengindeks tidak dapat membaca dokumen dari sumber data. Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Tipe bidang yang tidak konsisten di berbagai dokumen Type of value has a mismatch with column type. Couldn't store '{47.6,-122.1}' in authors column. Expected type is JArray. Error converting data type nvarchar to float. Conversion failed when converting the nvarchar value '12 months' to data type int. Arithmetic overflow error converting expression to data type int. Pastikan bahwa jenis setiap bidang sama di berbagai dokumen. Misalnya, jika bidang dokumen 'startTime' pertama adalah DateTime, dan di dokumen kedua itu adalah string, kesalahan ini ditemui.
Kesalahan dari layanan dasar sumber data Dari Azure Cosmos DB: {"Errors":["Request rate is large"]} Periksa instans penyimpanan Anda untuk memastikan bahwa kondisinya berfungsi dengan baik. Anda mungkin perlu menyesuaikan penskalaan atau partisi Anda.
Masalah sementara A transport-level error has occurred when receiving results from the server. (provider: TCP Provider, error: 0 - An existing connection was forcibly closed by the remote host Terkadang ada masalah konektivitas yang tidak terduga. Coba jalankan dokumen melalui pengindeks Anda lagi nanti.

Error: Could not extract content or metadata from your document

Pengindeks dengan sumber data Blob tidak dapat mengekstrak konten atau metadata dari dokumen (misalnya, file PDF). Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Blob melebihi batas ukuran Document is '150441598' bytes, which exceeds the maximum size '134217728' bytes for document extraction for your current service tier. Kesalahan pengindeksan blob
Blob memiliki tipe isi yang tidak didukung Document has unsupported content type 'image/png' Kesalahan pengindeksan blob
Blob sudah dienkripsi. Document could not be processed - it may be encrypted or password protected. Anda dapat mengabaikan blob dengan pengaturan blob.
Masalah sementara Error processing blob: The request was aborted: The request was canceled. Document timed out during processing. Terkadang ada masalah konektivitas yang tidak terduga. Coba jalankan dokumen melalui pengindeks Anda lagi nanti.

Error: Could not parse document

Pengindeks membaca dokumen dari sumber data, tetapi ada masalah saat mengonversi konten dokumen menjadi skema pemetaan bidang yang ditentukan. Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Kunci dokumen hilang Document key cannot be missing or empty Pastikan semua dokumen memiliki kunci dokumen yang valid. Kunci dokumen ditentukan dengan mengatur properti 'kunci' sebagai bagian dari definisi indeks. Pengindeks mengeluarkan kesalahan ini ketika properti yang ditandai sebagai 'kunci' tidak dapat ditemukan pada dokumen tertentu.
Kunci dokumen tidak valid Invalid document key. Keys can only contain letters, digits, underscore (_), dash (-), or equal sign (=). Pastikan semua dokumen memiliki kunci dokumen yang valid. Tinjau Pengindeksan Blob Storage untuk informasi lebih lanjut. Jika Anda menggunakan pengindeks blob, dan kunci dokumen Anda adalah bidang metadata_storage_path, pastikan definisi pengindeks memiliki fungsi pemetaan base64Encode yang sama dengan nullparameters, bukan jalur dalam teks biasa.
Kunci dokumen tidak valid Document key cannot be longer than 1024 characters Ubah kunci dokumen untuk memenuhi persyaratan validasi.
Tidak dapat menerapkan pemetaan bidang ke bidang Could not apply mapping function 'functionName' to field 'fieldName'. Array cannot be null. Parameter name: bytes Periksa kembali pemetaan bidang yang ditentukan pada pengindeks, dan bandingkan dengan data bidang yang ditentukan dari dokumen yang gagal. Mungkin perlu untuk mengubah pemetaan bidang atau data dokumen.
Tidak dapat membaca nilai bidang Could not read the value of column 'fieldName' at index 'fieldIndex'. A transport-level error has occurred when receiving results from the server. (provider: TCP Provider, error: 0 - An existing connection was forcibly closed by the remote host.) Kesalahan ini biasanya disebabkan oleh masalah konektivitas tak terduga dengan layanan yang mendasar sumber data. Coba jalankan dokumen melalui pengindeks Anda lagi nanti.

Error: Could not map output field 'xyz' to search index due to deserialization problem while applying mapping function 'abc'

Pemetaan output mungkin gagal karena data output dalam format yang salah untuk fungsi pemetaan yang Anda gunakan. Misalnya, menerapkan Base64Encode fungsi pemetaan pada data biner akan menghasilkan kesalahan ini. Untuk mengatasi masalah ini, jalankan ulang pengindeks tanpa menentukan fungsi pemetaan atau pastikan bahwa fungsi pemetaan kompatibel dengan jenis data bidang output. Lihat Pemetaan bidang output untuk detailnya.

Error: Could not execute skill

Pengindeks tidak dapat menjalankan kemampuan dalam kumpulan kemampuan.

Alasan Detail/Contoh Resolusi
Masalah konektivitas sementara Terjadi kesalahan sementara. Coba lagi nanti. Terkadang ada masalah konektivitas yang tidak terduga. Coba jalankan dokumen melalui pengindeks Anda lagi nanti.
Potensi bug pada produk Terjadi kesalahan tak terduga. Ini menunjukkan kelas kegagalan yang tidak diketahui dan dapat menunjukkan bug produk. Ajukan tiket dukungan untuk mendapatkan bantuan.
Skill mengalami kesalahan saat eksekusi (Dari Kemampuan Penggabungan) Satu atau beberapa nilai offset tidak valid dan tidak dapat diurai. Item-item telah disisipkan di akhir teks Gunakan informasi dalam pesan kesalahan untuk memperbaiki masalah. Kegagalan semacam ini memerlukan tindakan untuk mengatasinya.

Error: Could not execute skill because the Web API request failed

Pelaksanaan fitur gagal karena panggilan ke API Web gagal. Biasanya, kelas kegagalan ini terjadi ketika keterampilan kustom digunakan, dalam hal ini Anda perlu men-debug kode kustom Anda untuk menyelesaikan masalah. Jika kegagalan berasal dari keterampilan bawaan, lihat pesan kesalahan untuk membantu memperbaiki masalah.

Saat men-debug masalah ini, pastikan untuk memperhatikan peringatan input keterampilan apa pun untuk keterampilan ini. Titik akhir API Web Anda mungkin gagal karena pengindeks meneruskannya input yang tidak terduga.

Error: Could not execute skill because Web API skill response is invalid

Eksekusi keterampilan gagal karena panggilan ke API Web mengembalikan respons yang tidak valid. Biasanya, kelas kegagalan ini terjadi ketika keterampilan kustom digunakan, dalam hal ini Anda perlu men-debug kode kustom Anda untuk menyelesaikan masalah. Jika kegagalan berasal dari keterampilan bawaan, ajukan tiket dukungan untuk mendapatkan bantuan.

Error: Type of value has a mismatch with column type. Couldn't store in 'xyz' column. Expected type is 'abc'

Jika sumber data Anda memiliki bidang dengan tipe data yang berbeda dari bidang yang coba Anda petakan dalam indeks, Anda mungkin mengalami kesalahan ini. Periksa jenis data bidang sumber data Anda dan pastikan data tersebut dipetakan dengan benar ke jenis data indeks Anda.

Error: Skill did not execute within the time limit

Ada dua kasus di mana Anda mungkin mengalami pesan kesalahan ini, yang masing-masing harus diperlakukan secara berbeda. Ikuti petunjuk di bawah ini tergantung pada keterampilan apa yang mengembalikan kesalahan ini untuk Anda.

Keterampilan layanan Azure AI bawaan

Banyak keterampilan kognitif bawaan, seperti deteksi bahasa, pengenalan entitas, atau OCR, didukung oleh titik akhir API layanan Azure AI. Terkadang ada masalah sementara dengan titik akhir ini dan permintaan akan habis waktu. Untuk masalah sementara, tidak ada solusi kecuali menunggu lalu mencoba lagi. Sebagai mitigasi, pertimbangkan untuk mengatur pengindeks Anda agar berjalan sesuai jadwal. Pengindeksan terjadwal melanjutkan dari tempat terakhir. Dengan asumsi masalah sementara diselesaikan, pengindeksan dan pemrosesan keterampilan kognitif harus dapat dilanjutkan pada eksekusi terjadwal berikutnya.

Jika Anda terus melihat kesalahan ini pada dokumen yang sama untuk keterampilan kognitif bawaan, ajukan tiket dukungan untuk mendapatkan bantuan, karena ini tidak diharapkan.

Keterampilan khusus

Jika Anda mengalami kesalahan waktu habis pada kemampuan kustom, Anda bisa mencoba beberapa hal. Pertama, tinjau keterampilan kustom Anda dan pastikan bahwa keterampilan tersebut tidak terjebak dalam perulangan tak terbatas dan mengembalikan hasil secara konsisten. Setelah Anda mengonfirmasi bahwa hasil dikembalikan, periksa durasi eksekusi. Jika Anda tidak secara eksplisit menetapkan timeout nilai pada definisi keterampilan kustom Anda, maka defaultnya timeout adalah 30 detik. Jika 30 detik tidak cukup lama untuk dijalankan keterampilan Anda, Anda dapat menentukan nilai yang lebih tinggi timeout pada definisi keterampilan kustom Anda. Berikut adalah contoh definisi keterampilan kustom di mana batas waktu diatur ke 90 detik:

  {
        "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
        "uri": "<your custom skill uri>",
        "batchSize": 1,
        "timeout": "PT90S",
        "context": "/document",
        "inputs": [
          {
            "name": "input",
            "source": "/document/content"
          }
        ],
        "outputs": [
          {
            "name": "output",
            "targetName": "output"
          }
        ]
      }

Nilai maksimum yang dapat Anda tetapkan timeout untuk parameter adalah 230 detik. Jika keterampilan kustom Anda tidak dapat dijalankan secara konsisten dalam waktu 230 detik, Anda mungkin mempertimbangkan untuk mengurangi batchSize keterampilan kustom Anda sehingga memiliki lebih sedikit dokumen untuk diproses dalam satu eksekusi. Jika Anda telah mengatur batchSize ke 1, Anda perlu menulis ulang keterampilan untuk dapat mengeksekusi dalam waktu kurang dari 230 detik, atau membaginya menjadi beberapa keterampilan kustom sehingga waktu eksekusi untuk keterampilan kustom tunggal adalah maksimum 230 detik. Tinjau dokumentasi keterampilan kustom untuk informasi selengkapnya.

Error: Could not 'MergeOrUpload' | 'Delete' document to the search index

Dokumen dibaca dan diproses, tetapi pengindeks tidak dapat menambahkannya ke indeks pencarian. Hal ini dapat terjadi karena:

Alasan Detail/Contoh Resolusi
Bidang berisi istilah yang terlalu besar Istilah dalam dokumen Anda lebih besar dari batas 32 KB Anda dapat menghindari pembatasan ini dengan memastikan bidang tidak dikonfigurasi sebagai dapat difilter, dapat difaset, atau dapat diurutkan.
Dokumen terlalu besar untuk diindeks Dokumen lebih besar dari ukuran permintaan API maksimum Cara mengindeks himpunan data besar
Dokumen berisi terlalu banyak objek dalam koleksi Koleksi dalam dokumen Anda melebihi elemen maksimum di semua batas koleksi kompleks. The document with key '1000052' has '4303' objects in collections (JSON arrays). At most '3000' objects are allowed to be in collections across the entire document. Remove objects from collections and try indexing the document again. Sebaiknya kurangi ukuran koleksi kompleks dalam dokumen hingga di bawah batas dan hindari pemanfaatan penyimpanan yang tinggi.
Masalah saat menyambungkan ke indeks target (yang berlanjut setelah percobaan kembali) karena layanan berada di bawah beban lain, seperti kueri atau pengindeksan. Gagal membuat koneksi untuk memperbarui indeks. Layanan pencarian berada di bawah beban berat. Meningkatkan skala layanan pencarian Anda
Layanan pencarian sedang di-patch untuk pembaruan layanan, atau berada di tengah-tengah konfigurasi ulang topologi. Gagal membuat koneksi untuk memperbarui indeks. Layanan pencarian saat ini sedang tidak berfungsi/Layanan pencarian sedang mengalami transisi. Konfigurasi layanan dengan setidaknya tiga replika agar mencapai ketersediaan 99,9% sesuai dengan dokumentasi SLA
Kegagalan dalam sumber daya komputasi/jaringan yang mendasar (jarang) Gagal membuat koneksi untuk memperbarui indeks. Terjadi kegagalan yang tidak diketahui. Konfigurasikan pengindeks untuk berjalan sesuai jadwal agar dapat melanjutkan dari status gagal.
Permintaan pengindeksan yang dibuat ke indeks target tidak diakui dalam periode batas waktu karena masalah jaringan. Tidak dapat membuat koneksi ke indeks pencarian secara tepat waktu. Konfigurasikan pengindeks untuk berjalan sesuai jadwal untuk melanjutkan dari status gagal. Selain itu, coba turunkan ukuran batch pengindeks jika kondisi kesalahan ini tetap ada.

Error: Could not index document because some of the document's data was not valid

Dokumen dibaca dan diproses oleh pengindeks, tetapi karena ketidakcocokan dalam konfigurasi bidang indeks dan data yang diekstrak dan diproses oleh pengindeks, tidak dapat ditambahkan ke indeks pencarian. Hal ini dapat terjadi karena:

Alasan Detail/Contoh
Jenis data dari satu atau beberapa bidang yang diekstrak oleh pengindeks tidak kompatibel dengan model data bidang indeks target yang sesuai. The data field '_data_' in the document with key '888' has an invalid value 'of type 'Edm.String''. The expected type was 'Collection(Edm.String)'.
Gagal mengekstrak entitas JSON apa pun dari nilai string. Could not parse value 'of type 'Edm.String'' of field '_data_' as a JSON object. Error:'After parsing a value an unexpected character was encountered: ''. Path '_path_', line 1, position 3162.'
Gagal mengekstrak kumpulan entitas JSON dari nilai string. Could not parse value 'of type 'Edm.String'' of field '_data_' as a JSON array. Error:'After parsing a value an unexpected character was encountered: ''. Path '[0]', line 1, position 27.'
Tipe yang tidak diketahui diidentifikasi di dalam dokumen sumber. Unknown type '_unknown_' cannot be indexed
Notasi yang tidak kompatibel untuk titik geografi digunakan dalam dokumen sumber. WKT POINT string literals are not supported. Use GeoJson point literals instead

Dalam semua kasus ini, lihat Jenis data yang didukung dan Peta jenis data untuk pengindeks untuk memastikan bahwa Anda membangun skema indeks dengan benar dan telah menyiapkan pemetaan bidang pengindeks yang sesuai. Pesan kesalahan menyertakan detail yang dapat membantu melacak sumber ketidakcocokan.

Error: Integrated change tracking policy cannot be used because table has a composite primary key

Ini berlaku untuk tabel SQL, dan biasanya terjadi ketika kunci didefinisikan sebagai kunci komposit atau, ketika tabel telah menentukan indeks berkluster unik (seperti dalam indeks SQL, bukan indeks Azure Search). Alasan utamanya adalah bahwa atribut kunci dimodifikasi menjadi kunci primer komposit dalam indeks berkluster yang unik. Dalam hal ini, pastikan tabel SQL Anda tidak memiliki indeks berkluster yang unik, atau Anda memetakan bidang kunci ke bidang yang dijamin tidak memiliki nilai duplikat.

Error: Could not process document within indexer max run time

Kesalahan ini terjadi ketika pengindeks tidak dapat menyelesaikan pemrosesan satu dokumen dari sumber data dalam waktu eksekusi yang diizinkan. Waktu berjalan maksimum lebih pendek ketika set keterampilan digunakan. Ketika kesalahan ini terjadi, jika Anda memiliki maxFailedItems yang diatur ke nilai selain 0, pengindeks akan melewatkan dokumen pada eksekusi berikutnya untuk memungkinkan kemajuan pengindeksan. Jika Anda tidak mampu melewati dokumen apa pun, atau jika Anda melihat kesalahan ini secara konsisten, pertimbangkan untuk memecah dokumen menjadi dokumen yang lebih kecil sehingga kemajuan parsial dapat dilakukan dalam satu eksekusi pengindeks.

Error: Could not project document

Kesalahan ini terjadi ketika pengindeks mencoba memproyeksikan data ke penyimpanan pengetahuan dan ada kegagalan pada upaya tersebut. Kegagalan ini dapat berulang dan dapat diperbaiki, atau bisa menjadi kegagalan sementara dengan saluran keluaran proyeksi yang mungkin perlu Anda tunggu dan coba lagi untuk mengatasinya. Berikut adalah serangkaian status kegagalan yang diketahui dan kemungkinan resolusi.

Alasan Detail (Rincian)/Contoh Resolusi
Tidak dapat memperbarui proyeksi blob 'blobUri' dalam kontainer 'containerName' Kontainer yang ditentukan tidak ada. Pengindeks memeriksa apakah kontainer yang ditentukan telah dibuat sebelumnya dan akan membuatnya jika perlu, tetapi hanya melakukan pemeriksaan ini sekali per pengindeks berjalan. Kesalahan ini berarti bahwa sesuatu menghapus kontainer setelah langkah ini. Untuk mengatasi kesalahan ini, coba ini: biarkan informasi akun penyimpanan Anda saja, tunggu hingga pengindeks selesai, lalu jalankan ulang pengindeks.
Tidak dapat memperbarui proyeksi blob 'blobUri' dalam kontainer 'containerName' Tidak dapat menulis data ke koneksi transportasi: Koneksi yang ada ditutup secara paksa oleh host jarak jauh. Ini diharapkan menjadi kegagalan sementara dengan Azure Storage dan dengan demikian harus diselesaikan dengan menjalankan ulang pengindeks. Jika Anda mengalami kesalahan ini secara konsisten, ajukan tiket dukungan sehingga dapat diselidiki lebih lanjut.
Tidak dapat memperbarui baris 'projectionRow' dalam tabel 'tableName' Server sibuk. Ini diharapkan menjadi kegagalan sementara dengan Azure Storage dan dengan demikian harus diselesaikan dengan menjalankan ulang pengindeks. Jika Anda mengalami kesalahan ini secara konsisten, ajukan tiket dukungan sehingga dapat diselidiki lebih lanjut.

Error: The cognitive service for skill '<skill-name>' has been throttled

Eksekusi keterampilan gagal karena panggilan ke layanan Azure AI dibatasi. Biasanya, kelas kegagalan ini terjadi ketika terlalu banyak keterampilan yang dijalankan secara paralel. Jika Anda menggunakan pustaka klien Microsoft.Search.Documents untuk menjalankan pengindeks, Anda bisa menggunakan SearchIndexingBufferedSender untuk mendapatkan coba lagi otomatis pada langkah-langkah yang gagal. Jika tidak, Anda dapat mengatur ulang dan menjalankan ulang pengindeks.

Error: Expected IndexAction metadata

Kesalahan 'Metadata IndexAction yang Diharapkan' berarti ketika pengindeks mencoba membaca dokumen untuk mengidentifikasi tindakan apa yang harus diambil, itu tidak menemukan metadata yang sesuai pada dokumen. Biasanya, kesalahan ini terjadi ketika pengindeks memiliki cache anotasi yang ditambahkan atau dihapus tanpa mengatur ulang pengindeks. Untuk mengatasi hal ini, Anda harus mengatur ulang dan menjalankan ulang pengindeks.

Warning: Skill input was invalid

Input ke keterampilan hilang, memiliki jenis yang salah, atau sebaliknya, tidak valid. Anda mungkin melihat informasi berikut:

  • Could not execute skill

  • Skill executed but may have unexpected results

Keterampilan kognitif memiliki input yang diperlukan dan input opsional. Misalnya, keterampilan ekstraksi Frasa kunci memiliki dua input textyang diperlukan , languageCode, dan tidak ada input opsional. Input keterampilan kustom dianggap opsional.

Jika input yang diperlukan hilang atau jika input bukan jenis yang tepat, fungsi akan dilewati dan menghasilkan peringatan. Keterampilan yang dilewatkan tidak menghasilkan output. Jika keterampilan hilir mengonsumsi output keterampilan yang dilewati, mereka dapat menghasilkan peringatan lain.

Jika input opsional hilang, keterampilan masih berjalan, tetapi mungkin menghasilkan output yang tidak terduga karena input yang hilang.

Dalam kedua kasus, peringatan ini disebabkan oleh bentuk data Anda. Misalnya, jika Anda memiliki dokumen yang berisi informasi tentang orang dengan bidang firstName, , middleNamedan lastName, Anda mungkin memiliki beberapa dokumen yang tidak memiliki entri untuk middleName. Jika Anda meneruskan middleName sebagai input ke kemampuan dalam alur, maka diharapkan bahwa input kemampuan ini hilang pada beberapa waktu. Anda perlu mengevaluasi data dan skenario Anda untuk menentukan apakah tindakan apa pun diperlukan sebagai akibat dari peringatan ini atau tidak.

Jika Anda ingin memberikan nilai default untuk input yang hilang, Anda dapat menggunakan keterampilan Bersyarah untuk menghasilkan nilai default lalu menggunakan output keterampilan Bersyarah sebagai input keterampilan.

{
    "@odata.type": "#Microsoft.Skills.Util.ConditionalSkill",
    "context": "/document",
    "inputs": [
        { "name": "condition", "source": "= $(/document/language) == null" },
        { "name": "whenTrue", "source": "= 'en'" },
        { "name": "whenFalse", "source": "= $(/document/language)" }
    ],
    "outputs": [ { "name": "output", "targetName": "languageWithDefault" } ]
}
Alasan Detail/Contoh Resolusi
Jenis input keterampilan salah "Input keterampilan yang diperlukan bukan dari jenis Stringyang diharapkan . Nama: text, Sumber: /document/merged_content." "Input keterampilan yang diperlukan bukan dalam format yang diharapkan. Nama: text, Sumber: /document/merged_content." "Tidak dapat melakukan iterasi melalui non-array /document/normalized_images/0/imageCelebrities/0/detail/celebrities." "Tidak dapat memilih 0 di non-array /document/normalized_images/0/imageCelebrities/0/detail/celebrities" Keterampilan tertentu mengharapkan input dari jenis tertentu, misalnya Keterampilan sentimen mengharapkan text berupa string. Jika input menentukan nilai nonstring, maka keterampilan tidak dijalankan dan tidak menghasilkan output. Pastikan himpunan data Anda memiliki nilai input yang seragam dalam jenis, atau gunakan keterampilan API Web Kustom untuk memproses input sebelumnya. Jika Anda mengiterasi kemampuan melalui array, pastikan konteks kemampuan dan input memiliki * di posisi yang benar. Biasanya konteks dan sumber input harus diakhir dengan * untuk array.
Input keterampilan hilang Required skill input is missing. Name: text, Source: /document/merged_content Missing value /document/normalized_images/0/imageTags. Unable to select 0 in array /document/pages of length 0. Jika peringatan ini terjadi untuk semua dokumen, mungkin ada kesalahan ketik di jalur input. Periksa casing nama properti. Periksa apakah ada tambahan atau yang hilang * pada jalur. Verifikasi bahwa dokumen dari sumber data menyediakan input yang diperlukan.
Input kode bahasa keterampilan tidak valid languageCode Masukan keterampilan memiliki kode bahasa berikut X,Y,Z, setidaknya salah satunya tidak valid. Lihat lebih detail di bawah ini.

Warning: Skill input 'languageCode' has the following language codes 'X,Y,Z', at least one of which is invalid.

Satu atau beberapa nilai yang dimasukkan ke dalam input opsional languageCode dari kemampuan hilir tidak didukung. Ini dapat terjadi jika Anda meneruskan output LanguageDetectionSkill ke keterampilan berikutnya, dan output terdiri dari lebih banyak bahasa daripada yang didukung dalam keterampilan hilir tersebut.

Perhatikan bahwa Anda juga bisa mendapatkan peringatan yang mirip dengan ini jika input yang tidak valid countryHint diteruskan ke LanguageDetectionSkill. Jika itu terjadi, validasi bahwa bidang yang Anda gunakan dari sumber data untuk input tersebut berisi kode negara dua huruf ISO 3166-1 alpha-2 yang valid. Jika beberapa valid dan beberapa tidak valid, lanjutkan dengan panduan berikut tetapi ganti languageCode dengan countryHint dan defaultLanguageCode dengan defaultCountryHint untuk mencocokkan kasus penggunaan Anda.

Jika Anda tahu bahwa himpunan data Anda semuanya dalam satu bahasa, Anda harus menghapus LanguageDetectionSkill dan languageCode input keterampilan dan menggunakan defaultLanguageCode parameter keterampilan untuk keterampilan tersebut, dengan asumsi bahasa tersebut didukung untuk keterampilan tersebut.

Jika Anda tahu bahwa himpunan data Anda berisi beberapa bahasa dan dengan demikian Anda memerlukan LanguageDetectionSkill dan languageCode input, pertimbangkan untuk menambahkan ConditionalSkill untuk memfilter teks dengan bahasa yang tidak didukung sebelum meneruskan teks ke keterampilan hilir. Berikut adalah contoh tampilannya untuk EntityRecognitionSkill:

{
    "@odata.type": "#Microsoft.Skills.Util.ConditionalSkill",
    "context": "/document",
    "inputs": [
        { "name": "condition", "source": "= $(/document/language) == 'de' || $(/document/language) == 'en' || $(/document/language) == 'es' || $(/document/language) == 'fr' || $(/document/language) == 'it'" },
        { "name": "whenTrue", "source": "/document/content" },
        { "name": "whenFalse", "source": "= null" }
    ],
    "outputs": [ { "name": "output", "targetName": "supportedByEntityRecognitionSkill" } ]
}

Berikut adalah beberapa referensi untuk bahasa yang saat ini didukung untuk setiap keterampilan yang dapat menghasilkan pesan kesalahan ini:

Warning: Skill input was truncated

Keterampilan kognitif membatasi panjang teks yang dapat dianalisis pada satu waktu. Jika input teks melebihi batas, teks dipotong sebelum diperkaya. Fitur berfungsi, tetapi tidak mencakup semua data Anda.

Dalam contoh LanguageDetectionSkill di bawah ini, 'text' bidang input mungkin memicu peringatan ini jika input melebihi batas karakter. Batas input dapat ditemukan dalam dokumentasi referensi keterampilan.

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [...]
  }

Jika Anda ingin memastikan bahwa semua teks dianalisis, pertimbangkan untuk menggunakan keterampilan Pisahkan.

Warning: Web API skill response contains warnings

Pengindeks menjalankan fitur dalam kumpulan fitur, tetapi respons dari permintaan Web API menunjukkan adanya peringatan. Tinjau peringatan untuk memahami dampak data Anda dan apakah tindakan lebih lanjut diperlukan.

Warning: The current indexer configuration does not support incremental progress

Peringatan ini hanya terjadi untuk sumber data Azure Cosmos DB.

Kemajuan bertahap selama pengindeksan memastikan bahwa jika eksekusi pengindeks terganggu oleh kegagalan sementara atau batas waktu eksekusi, pengindeks dapat melanjutkan dari titik terakhir di mana dijalankan berikutnya, alih-alih harus mengindeks ulang seluruh kumpulan data dari awal. Ini sangat penting saat mengindeks koleksi besar.

Kemampuan untuk melanjutkan pekerjaan pengindeksan yang belum selesai didasarkan pada dokumen yang diurutkan berdasarkan kolom _ts. Pengindeks menggunakan tanda waktu untuk menentukan dokumen mana yang akan diambil berikutnya. _ts Jika kolom hilang atau jika pengindeks tidak dapat menentukan apakah kueri kustom diurutkan olehnya, pengindeks dimulai pada awalnya dan Anda akan melihat peringatan ini.

Dimungkinkan untuk mengambil alih perilaku ini, memungkinkan kemajuan bertambah bertahap dan menekan peringatan ini dengan menggunakan assumeOrderByHighWaterMarkColumn properti konfigurasi.

Untuk informasi selengkapnya, lihat Kemajuan inkremental dan kueri kustom.

Warning: Some data was lost during projection. Row 'X' in table 'Y' has string property 'Z' which was too long.

Layanan Table Storage memiliki batasan ukuran properti entitas. String dapat memiliki 32.000 karakter atau kurang. Jika baris dengan properti string yang lebih panjang dari 32.000 karakter sedang diproyeksikan, hanya 32.000 karakter pertama yang dipertahankan. Untuk mengatasi masalah ini, hindari memproyeksikan baris dengan properti string yang lebih panjang dari 32.000 karakter.

Warning: Truncated extracted text to X characters

Pengindeks membatasi berapa banyak teks yang dapat diekstrak dari satu dokumen. Batas ini tergantung pada tingkat harga: 32.000 karakter untuk tingkat Gratis, 64.000 untuk Dasar, 4 juta untuk Standar, 8 juta untuk Standard S2, dan 16 juta untuk Standard S3. Teks yang dipotong tidak akan diindeks. Untuk menghindari peringatan ini, coba pisahkan dokumen dengan teks dalam jumlah besar menjadi beberapa dokumen yang lebih kecil.

Untuk informasi selengkapnya, lihat Batas pengindeks.

Warning: Could not map output field 'X' to search index

Pemetaan bidang output yang mereferensikan data yang tidak ada/null akan menghasilkan peringatan untuk setiap dokumen dan menghasilkan bidang indeks kosong. Untuk mengatasi masalah ini, periksa kembali jalur sumber pemetaan bidang output Anda untuk kemungkinan kesalahan ketik, atau atur nilai default menggunakan keterampilan Kondisional. Lihat Pemetaan bidang output untuk detailnya.

Alasan Detail/Contoh Resolusi
Tidak dapat melakukan iterasi melalui non-array "Tidak dapat melakukan iterasi melalui non-array /document/normalized_images/0/imageCelebrities/0/detail/celebrities." Kesalahan ini terjadi ketika output bukan array. Jika Menurut Anda output harus berupa array, periksa jalur bidang sumber output yang ditunjukkan untuk kesalahan. Misalnya, Anda mungkin memiliki karakter yang hilang atau tambahan * dalam nama bidang sumber. Ada juga kemungkinan bahwa input ke kemampuan ini adalah null, yang menghasilkan array kosong. Temukan detail serupa di bagian Masukan Keterampilan Tidak Valid.
Tidak dapat memilih 0 dalam non-array "Tidak dapat memilih 0 di non-array /document/pages." Ini bisa terjadi jika output keterampilan tidak menghasilkan array dan nama bidang sumber output memiliki indeks array atau * di jalurnya. Periksa kembali jalur yang disediakan dalam nama bidang sumber output dan nilai bidang untuk nama bidang yang ditunjukkan. Temukan detail serupa di bagian "Input Keterampilan Tidak Valid".

Warning: The data change detection policy is configured to use key column 'X'

Kebijakan deteksi perubahan data memiliki persyaratan khusus untuk kolom yang mereka gunakan untuk mendeteksi perubahan. Salah satu persyaratan ini adalah bahwa kolom ini diperbarui setiap kali item sumber diubah. Persyaratan lain adalah bahwa nilai baru untuk kolom ini lebih besar dari nilai sebelumnya. Kolom kunci tidak memenuhi persyaratan ini karena tidak berubah pada setiap pembaruan. Untuk mengatasi masalah ini, pilih kolom lain untuk kebijakan deteksi perubahan.

Warning: Document text appears to be UTF-16 encoded, but is missing a byte order mark

Mode penguraian pengindeks perlu mengetahui bagaimana teks dikodekan sebelum mengurainya. Dua cara paling umum untuk mengodekan teks adalah UTF-16 dan UTF-8. UTF-8 adalah pengodean panjang variabel di mana setiap karakter memiliki panjang antara 1 byte dan 4 byte. UTF-16 adalah pengodean panjang tetap di mana setiap karakter memiliki panjang 2 byte. UTF-16 memiliki dua varian yang berbeda, big endian dan little endian. Pengodean teks ditentukan oleh byte order mark, serangkaian byte sebelum teks.

Pengkodean Tanda Urutan Byte
UTF-16 Big Endian 0xFE 0xFF
UTF-16 Little Endian 0xFF 0xFE
UTF-8 0xEF 0xBB 0xBF

Jika tidak ada tanda urutan byte yang ada, teks diasumsikan dikodekan sebagai UTF-8.

Untuk mengatasi peringatan ini, tentukan apa pengodean teks untuk blob ini dan tambahkan tanda urutan byte yang sesuai.

Warning: Azure Cosmos DB collection 'X' has a Lazy indexing policy. Some data may be lost

Koleksi dengan kebijakan pengindeksan Malas tidak dapat dikueri secara konsisten, yang mengakibatkan pengindeks Anda kehilangan data. Untuk mengatasi peringatan ini, ubah kebijakan pengindeksan Anda menjadi Konsisten.

Warning: The document contains very long words (longer than 64 characters). These words may result in truncated and/or unreliable model predictions.

Peringatan ini diteruskan dari layanan Bahasa pada layanan Azure AI. Dalam beberapa kasus, aman untuk mengabaikan peringatan ini, misalnya jika string panjang hanyalah URL panjang. Ketahuilah bahwa ketika kata lebih panjang dari 64 karakter, kata 'dipotong menjadi 64 karakter yang dapat memengaruhi prediksi model.

Error: Cannot write more bytes to the buffer than the configured maximum buffer size

Pengindeks memiliki batas ukuran dokumen. Pastikan bahwa dokumen di sumber data Anda lebih kecil dari batas ukuran yang didukung, seperti yang didokumenkan untuk tingkat layanan Anda.

Error: Failed to compare value 'X' of type M to value 'Y' of type N.

Kesalahan ini biasanya terjadi di pengindeks Azure SQL ketika jenis kolom sumber yang digunakan tidak cocok dengan dataChangeDetectionPolicy apa yang diharapkan pengindeks, terutama jika convertHighWaterMarkToRowVersion diaktifkan.

Misalnya, jika kolom yang digunakan untuk deteksi perubahan adalah jenis tanggalwaktu, tetapi pengindeks mengharapkan jenis rowversion karena convertHighWaterMarkToRowVersion diaktifkan, ketidakcocokan akan menyebabkan kesalahan.

Periksa jenis data untuk kolom 'Tanda Air Tinggi' di sumber dan perbarui konfigurasi pengindeks yang sesuai. Setelah diverifikasi dan diperbarui, reset dan jalankan ulang pengindeks untuk memproses nilai kolom.