مشاركة عبر


IndexingParametersConfiguration interface

قاموس لخصائص التكوين الخاصة بمفهرس. كل اسم هو اسم خاصية معينة. يجب أن تكون كل قيمة من نوع بدائي.

الخصائص

allowSkillsetToReadFileData

إذا كان صحيحا، فسينشئ مسارا /document/file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.

dataToExtract

تحديد البيانات المراد استخراجها من تخزين Azure blob وإخبار المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.

delimitedTextDelimiter

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").

delimitedTextHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.

documentRoot

بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.

excludedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.

executionEnvironment

تحديد البيئة التي يجب أن ينفذ فيها المفهرس.

failOnUnprocessableDocument

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، اضبط على false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.

failOnUnsupportedContentType

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.

firstLineContainsHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.

imageAction

تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.

indexedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيق معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.

indexStorageMetadataOnlyForOversizedDocuments

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا بحيث لا يمكن معالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم كأخطاء بشكل افتراضي. للحصول على حدود لحجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

parsingMode

يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.

pdfTextRotationAlgorithm

تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.

queryTimeout

يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".

تفاصيل الخاصية

allowSkillsetToReadFileData

إذا كان صحيحا، فسينشئ مسارا /document/file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.

allowSkillsetToReadFileData?: boolean

قيمة الخاصية

boolean

dataToExtract

تحديد البيانات المراد استخراجها من تخزين Azure blob وإخبار المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

قيمة الخاصية

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").

delimitedTextDelimiter?: string

قيمة الخاصية

string

delimitedTextHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.

delimitedTextHeaders?: string

قيمة الخاصية

string

documentRoot

بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.

documentRoot?: string

قيمة الخاصية

string

excludedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.

excludedFileNameExtensions?: string

قيمة الخاصية

string

executionEnvironment

تحديد البيئة التي يجب أن ينفذ فيها المفهرس.

executionEnvironment?: "standard" | "private"

قيمة الخاصية

"standard" | "private"

failOnUnprocessableDocument

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، اضبط على false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.

failOnUnprocessableDocument?: boolean

قيمة الخاصية

boolean

failOnUnsupportedContentType

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.

failOnUnsupportedContentType?: boolean

قيمة الخاصية

boolean

firstLineContainsHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.

firstLineContainsHeaders?: boolean

قيمة الخاصية

boolean

imageAction

تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

قيمة الخاصية

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيق معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.

indexedFileNameExtensions?: string

قيمة الخاصية

string

indexStorageMetadataOnlyForOversizedDocuments

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا بحيث لا يمكن معالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم كأخطاء بشكل افتراضي. للحصول على حدود لحجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

قيمة الخاصية

boolean

parsingMode

يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

قيمة الخاصية

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

قيمة الخاصية

"none" | "detectAngles"

queryTimeout

يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".

queryTimeout?: string

قيمة الخاصية

string