Bagikan melalui


struktur STAT_CHUNK (filter.h)

Catatan

Layanan Pengindeksan tidak lagi didukung pada Windows XP dan tidak tersedia untuk digunakan pada Windows 8. Sebagai gantinya, gunakan Windows Search untuk pencarian sisi klien dan Microsoft Search Server Express untuk pencarian sisi server.

Menjelaskan karakteristik gugus.

Sintaks

typedef struct tagSTAT_CHUNK {
  ULONG           idChunk;
  CHUNK_BREAKTYPE breakType;
  CHUNKSTATE      flags;
  LCID            locale;
  FULLPROPSPEC    attribute;
  ULONG           idChunkSource;
  ULONG           cwcStartSource;
  ULONG           cwcLenSource;
} STAT_CHUNK;

Anggota

idChunk

Pengidentifikasi gugus. Pengidentifikasi gugus harus unik untuk instans antarmuka IFilter saat ini. Pengidentifikasi gugus harus dalam urutan naik. Urutan di mana potongan diberi nomor harus sesuai dengan urutan kemunculannya dalam dokumen sumber. Beberapa mesin pencari dapat memanfaatkan kedekatan potongan berbagai properti. Jika demikian, urutan pemotongan dengan properti yang berbeda dikeluarkan akan penting bagi mesin pencari.

breakType

Jenis jeda yang memisahkan gugus sebelumnya dari gugus saat ini. Nilai berasal dari enumerasi CHUNK_BREAKTYPE .

flags

Menunjukkan apakah gugus ini berisi properti tipe teks atau tipe nilai. Nilai bendera diambil dari enumerasi CHUNKSTATE . Jika bendera CHUNK_TEXT diatur, IFilter::GetText harus digunakan untuk mengambil konten gugus sebagai serangkaian kata. Jika bendera CHUNK_VALUE diatur, IFilter::GetValue harus digunakan untuk mengambil nilai dan memperlakukannya sebagai nilai properti tunggal. Jika filter menentukan bahwa konten yang sama diperlakukan sebagai teks dan sebagai nilai, potongan harus dipancarkan dua kali dalam dua gugus yang berbeda, masing-masing dengan satu set bendera.

locale

Bahasa dan sublanguage yang terkait dengan potongan teks. Lokal potongan digunakan oleh pengindeks dokumen untuk melakukan pemecahan kata teks yang tepat. Jika gugus bukan tipe teks atau jenis nilai dengan jenis data VT_LPWSTR, VT_LPSTR, atau VT_BSTR, bidang ini diabaikan.

attribute

Properti yang akan diterapkan ke gugus. Lihat FULLPROPSPEC. Jika filter mengharuskan teks yang sama memiliki lebih dari satu properti, filter perlu memancarkan teks sekali untuk setiap properti dalam potongan terpisah.

idChunkSource

ID sumber gugus. Nilai anggota idChunkSource tergantung pada sifat gugus:

  • Jika gugus adalah properti jenis teks, nilai anggota idChunkSource harus sama dengan nilai anggota idChunk .
  • Jika gugus adalah properti jenis nilai internal yang berasal dari konten tekstual, nilai anggota idChunkSource adalah ID gugus untuk potongan jenis teks tempatnya diturunkan.
  • Jika atribut filter menentukan untuk hanya mengembalikan properti jenis nilai internal, tidak ada potongan konten untuk memperoleh properti jenis nilai internal saat ini. Dalam hal ini, nilai anggota idChunkSource harus diatur ke nol, yang merupakan gugus yang tidak valid.

cwcStartSource

Offset dari mana teks sumber untuk gugus turunan dimulai di potongan sumber.

cwcLenSource

Panjang karakter teks sumber dari mana gugus saat ini diturunkan. Nilai nol menandakan korespondensi karakter demi karakter antara teks sumber dan teks turunan. Nilai bukan nol berarti bahwa tidak ada korespondensi langsung seperti itu.

Keterangan

Tiga anggota terakhir (idChunkSource, cwcStartSource, dan cwcLenSource) digunakan untuk menggambarkan sumber gugus turunan; yaitu, salah satu yang dapat dipetakan kembali ke bagian teks. Misalnya, judul bab dapat berupa properti jenis teks dan properti jenis nilai internal ? sebuah judul. Properti jenis nilai "judul" akan menjadi potongan turunan. Jika teks potongan jenis nilai saat ini (dari properti jenis nilai internal) berasal dari beberapa gugus jenis teks, maka teks harus dipancarkan lebih dari sekali.

Segmen berikut adalah contoh bagaimana hal ini mungkin terjadi dalam buku.

Detektif kecil menyatakan, "C'est fini!"

Pengakuan

Ruangan itu diam selama beberapa menit. Setelah berpikir keras tentang hal itu, wanita muda itu bertanya, "Tapi bagaimana kau tahu?"

Segmen ini mungkin dipecah menjadi potongan dengan cara berikut.

ID Teks BreakType Bendera Lokal Atribut
1 Dete kecil T/A CHUNK_TEXT ENGLISH_UK KONTEN
2 ctive diklaim, CHUNK_NO_BREAK T/A T/A T/A
3 "C'est fini!" CHUNK_EOW CHUNK_TEXT FRENCH_BELGIAN KONTEN
4 Pengakuan CHUNK_EOC CHUNK_TEXT ENGLISH_UK CHAPTER_NAMES
5 Pengakuan CHUNK_EOP CHUNK_TEXT ENGLISH_UK KONTEN
6 Ruangan itu diam selama beberapa menit. CHUNK_EOP CHUNK_TEXT ENGLISH_UK KONTEN
7 Setelah berpikir keras tentang hal itu, wanita muda itu bertanya, "Tapi bagaimana kau tahu?" CHUNK_EOS CHUNK_TEXT ENGLISH_UK KONTEN
 

Informasi yang disediakan oleh idChunkSource, cwcStartSource, dan cwcLenSource berguna untuk mesin pencari yang menyoroti hit. Jika kueri dilakukan untuk properti jenis nilai internal, mesin pencari akan menyoroti teks asli dari mana teks properti jenis nilai internal telah diturunkan. Misalnya, dalam filter kode C++, browser, saat mencari MyFunction dalam properti jenis nilai internal "definisi fungsi," akan menyoroti header fungsi dalam file.

Persyaratan

Persyaratan Nilai
Klien minimum yang didukung Windows 2000 Professional [hanya aplikasi desktop]
Server minimum yang didukung Windows 2000 Server [hanya aplikasi desktop]
Header filter.h

Lihat juga

CHUNKSTATE

CHUNK_BREAKTYPE

FULLPROPSPEC

IFilter