Bagikan melalui


enumerasi IFILTER_INIT (filter.h)

[Layanan Pengindeksan tidak lagi didukung pada Windows XP dan tidak tersedia untuk digunakan pada Windows 8. Sebagai gantinya, gunakan Windows Search untuk pencarian sisi klien dan Microsoft Search Server Express untuk pencarian sisi server.]

Bendera yang mengontrol proses pemfilteran.

Sintaks

typedef enum tagIFILTER_INIT {
  IFILTER_INIT_CANON_PARAGRAPHS = 1,
  IFILTER_INIT_HARD_LINE_BREAKS = 2,
  IFILTER_INIT_CANON_HYPHENS = 4,
  IFILTER_INIT_CANON_SPACES = 8,
  IFILTER_INIT_APPLY_INDEX_ATTRIBUTES = 16,
  IFILTER_INIT_APPLY_OTHER_ATTRIBUTES = 32,
  IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES = 256,
  IFILTER_INIT_INDEXING_ONLY = 64,
  IFILTER_INIT_SEARCH_LINKS = 128,
  IFILTER_INIT_FILTER_OWNED_VALUE_OK = 512,
  IFILTER_INIT_FILTER_AGGRESSIVE_BREAK = 1024,
  IFILTER_INIT_DISABLE_EMBEDDED = 2048,
  IFILTER_INIT_EMIT_FORMATTING = 4096
} IFILTER_INIT;

Konstanta

 
IFILTER_INIT_CANON_PARAGRAPHS
Nilai: 1
Hentian paragraf harus ditandai dengan Unicode PARAGRAPH SEPARATOR (0x2029).
IFILTER_INIT_HARD_LINE_BREAKS
Nilai: 2
Pengembalian lunak, seperti karakter baris baru dalam Word, harus digantikan oleh hard return? PEMISAH GARIS (0x2028). Hard return yang ada dapat digandakan. Pengembalian pengangkutan (0x000D), umpan garis (0x000A), atau pengembalian pengangkutan dan umpan garis dalam kombinasi harus dianggap sebagai hard return. Tujuannya adalah untuk mengaktifkan kecocokan ekspresi pola yang cocok dengan jeda baris yang diamati.
IFILTER_INIT_CANON_HYPHENS
Nilai: 4
Berbagai program pemrosesan kata memiliki bentuk tanda hubung yang tidak diwakili dalam kumpulan karakter host, seperti tanda hubung opsional (hanya muncul di akhir baris) dan tanda hubung yang tidak putus. Bendera ini menunjukkan bahwa tanda hubung opsional akan dikonversi ke null, dan tanda hubung non-putus akan dikonversi ke tanda hubung normal (0x2010), atau HYPHEN-MINUSES (0x002D).
IFILTER_INIT_CANON_SPACES
Nilai: 8
Sama seperti bendera IFILTER_INIT_CANON_HYPHENS menstandarkan tanda hubung, bendera ini menstandarkan spasi. Semua karakter spasi khusus, seperti spasi yang tidak terganggu, dikonversi ke karakter spasi standar (0x0020).
IFILTER_INIT_APPLY_INDEX_ATTRIBUTES
Nilai: 16
Menunjukkan bahwa klien ingin teks dibagi menjadi potongan yang mewakili properti jenis nilai internal.
IFILTER_INIT_APPLY_OTHER_ATTRIBUTES
Nilai: 32
Properti apa pun yang tidak dicakup oleh bendera IFILTER_INIT_APPLY_INDEX_ATTRIBUTES dan IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES harus dipancarkan.
IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES
Nilai: 256
Menunjukkan bahwa klien ingin teks dibagi menjadi potongan yang mewakili properti yang ditentukan selama proses pengindeksan.
IFILTER_INIT_INDEXING_ONLY
Nilai: 64
Mengoptimalkan IFilter untuk pengindeksan karena klien memanggil metode IFilter::Init hanya sekali dan tidak memanggil IFilter::BindRegion. Ini menghilangkan kemungkinan mengakses gugus baik sebelum dan sesudah mengakses gugus lain.
IFILTER_INIT_SEARCH_LINKS
Nilai: 128
Proses ekstraksi teks harus secara rekursif mencari semua objek yang ditautkan dalam dokumen. Jika tautan tidak tersedia, panggilan IFilter::GetChunk yang akan mendapatkan potongan pertama tautan harus mengembalikan FILTER_E_LINK_UNAVAILABLE.
IFILTER_INIT_FILTER_OWNED_VALUE_OK
Nilai: 512
Proses pengindeksan konten dapat mengembalikan nilai properti yang ditetapkan oleh filter.
IFILTER_INIT_FILTER_AGGRESSIVE_BREAK
Nilai: 1024
TBD
IFILTER_INIT_DISABLE_EMBEDDED
Nilai: 2048
TBD
IFILTER_INIT_EMIT_FORMATTING
Nilai: 4096
TBD

Keterangan

Umumnya, output teks dengan metode IFilter::GetText harus sama persis dengan teks dokumen yang sebenarnya. Namun, untuk mencapai interoperabilitas maksimum, beberapa standardisasi fitur umum diinginkan. Fitur-fitur ini termasuk pemisah paragraf, hentian baris, tanda hubung, dan spasi. Server antarmuka IFilter juga dapat menyematkan karakter null dalam teks, yang hampir diabaikan oleh klien. Artinya, karakter Unicode 0x0000 benar-benar diabaikan dan 0x0001 diperlakukan sebagai istirahat kata.

Empat bendera mengontrol standardisasi teks: IFILTER_INIT_CANON_PARAGRAPHS, IFILTER_INIT_HARD_LINE_BREAKS, IFILTER_INIT_CANON_HYPHENS, dan IFILTER_INIT_CANON_SPACES.

Klien antarmuka IFilter yang berbeda menginginkan tampilan objek yang berbeda. Tiga bendera, IFILTER_INIT_APPLY_INDEX_ATTRIBUTES, IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES, dan IFILTER_INIT_APPLY_OTHER_ATTRIBUTES, mengontrol kumpulan properti yang harus diterapkan ke gugus. Selain itu, properti tertentu dapat diminta dalam panggilan ke metode IFilter::Init sebagai array cAttributes ukuran, yang disimpan dalam aAttributes.

Implementasi antarmuka IFilter perlu menyimpan beberapa informasi potongan saat operasi selain pengindeksan konten terjadi. IFILTER_INIT_INDEXING_ONLY mengoptimalkan filter untuk pengindeksan.

Untuk tujuan tampilan, mungkin diinginkan untuk mencari di seluruh tautan serta dalam dokumen dan objek apa pun yang disematkannya. IFILTER_INIT_SEARCH_LINKS menentukan pencarian rekursif semua tautan.

Implementasi antarmuka IFilter tertentu mungkin menghasilkan nilai properti selama proses pengindeksan konten, dan IFILTER_INIT_FILTER_OWNED_VALUE_OK menunjukkan bahwa tidak masalah untuk mengembalikan nilai-nilai ini.

Persyaratan

   
Klien minimum yang didukung Windows 2000 Professional [hanya aplikasi desktop]
Server minimum yang didukung Windows 2000 Server [hanya aplikasi desktop]
Header filter.h

Lihat juga

IFilter