3.1.7 Document Set Files

The following two files store a document set file, as specified in section 2.7, in the example full-text index catalog in the indexed bitmap document set scheme, as specified in section 2.7.3.

This is the 000100006.wid file in the example set.

 0000    02  00  00  00  05  00  00  00 - 00  00  00  00  00  00  00  00
 0010    98  00  00  00  00  00  00  00 - 00  00  00  00  01  00  00  00
 0020    02  00  00  00  99  00  00  00 - 00  00  00  00  00  00  00  00
 0030    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 0040    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 …
 ffe0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 fff0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00

The preceding file has the following structure.


0


1


2


3


4


5


6


7


8


9

1
0


1


2


3


4


5


6


7


8


9

2
0


1


2


3


4


5


6


7


8


9

3
0


1

Type of scheme

Bdate

Flag

Outdated DocIDs

Number of DocIDs

Reserved1

Reserved2

SizeOfH1

Minimum DocID Value

Maximum DocID Value

Number of DocIDs Delta

Reserved3 (4052 bytes)

...

H1 (4 bytes)

Type of scheme (4 bytes): Set to 02 00 00 00 for Scheme = 2.

Bdate (4 bytes): Set to 05 00 00 00.

Flag (4 bytes): Set to 00 00 00 00.

Outdated DocIDs (4 bytes): Set to 00 00 00 00.

Number of DocIDs (4 bytes): Set to 98 00 00 00.

Reserved1 (4 bytes): Set to 00 00 00 00.

Reserved2 (4 bytes): Set to 00 00 00 00.

SizeOfH1 (4 bytes): Set to 01 00 00 00.

Minimum DocID Value (4 bytes): Set to 02 00 00 00.

Maximum DocID Value (4 bytes): Set to 99 00 00 00.

Number of DocIDs Delta (4 bytes): Set to 00 00 00 00.

Reserved3 (4052 bytes): Set to all zeros from address 002c through 1000.

H1 (4 bytes): Set to 00 00 00 00.

This is the 000100006.wsb file in the example set.

 0000    fc  ff  ff  ff  ff  ff  ff  ff - ff  ff  ff  ff  ff  ff  ff  ff
 0010    ff  ff  ff  03  00  00  00  00 - 00  00  00  00  00  00  00  00
 0020    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 …
 ffe0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 fff0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
  

The preceding file has the following structure.


0


1


2


3


4


5


6


7


8


9

1
0


1


2


3


4


5


6


7


8


9

2
0


1


2


3


4


5


6


7


8


9

3
0


1

Array of Page of Masks (8192 bytes)

...

Reserved1 (57344 bytes)

...

Array of Page of Masks (8192 bytes): Bits corresponding to document identifiers (1) present in the document set file.

Reserved1 (57344 bytes): Set to all zeros.

The same example in List Document Set format, as specified in section 2.7.1, 000100006.wid in the example set:

 0000    01  00  00  00  05  00  00  00 - 00  00  00  00  00  00  00  00
 0010    98  00  00  00  00  00  00  00 - 00  00  00  00  98  00  00  00
 0020    02  00  00  00  99  00  00  00 - 00  00  00  00  00  00  00  00
 0030    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 0040    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 …
 0fe0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 0ff0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 1000    02  00  00  00  03  00  00  00 - 04  00  00  00  05  00  00  00
 1010    06  00  00  00  07  00  00  00 - 08  00  00  00  09  00  00  00
 1020    0a  00  00  00  0b  00  00  00 - 0c  00  00  00  0d  00  00  00
 1030    0e  00  00  00  0f  00  00  00 - 10  00  00  00  11  00  00  00
 1040    12  00  00  00  13  00  00  00 - 14  00  00  00  15  00  00  00
 1050    16  00  00  00  17  00  00  00 - 18  00  00  00  19  00  00  00
 1060    1a  00  00  00  1b  00  00  00 - 1c  00  00  00  1d  00  00  00
 1070    1e  00  00  00  1f  00  00  00 - 20  00  00  00  21  00  00  00
 1080    22  00  00  00  23  00  00  00 - 24  00  00  00  25  00  00  00
 1090    26  00  00  00  27  00  00  00 - 28  00  00  00  29  00  00  00
 10a0    2a  00  00  00  2b  00  00  00 - 2c  00  00  00  2d  00  00  00
 10b0    2e  00  00  00  2f  00  00  00 - 30  00  00  00  31  00  00  00
 10c0    32  00  00  00  33  00  00  00 - 34  00  00  00  35  00  00  00
 10d0    36  00  00  00  37  00  00  00 - 38  00  00  00  39  00  00  00
 10e0    3a  00  00  00  3b  00  00  00 - 3c  00  00  00  3d  00  00  00
 10f0    3e  00  00  00  3f  00  00  00 - 40  00  00  00  41  00  00  00
 1100    42  00  00  00  43  00  00  00 - 44  00  00  00  45  00  00  00
 1110    46  00  00  00  47  00  00  00 - 48  00  00  00  49  00  00  00
 1120    4a  00  00  00  4b  00  00  00 - 4c  00  00  00  4d  00  00  00
 1130    4e  00  00  00  4f  00  00  00 - 50  00  00  00  51  00  00  00
 1140    52  00  00  00  53  00  00  00 - 54  00  00  00  55  00  00  00
 1150    56  00  00  00  57  00  00  00 - 58  00  00  00  59  00  00  00
 1160    5a  00  00  00  5b  00  00  00 - 5c  00  00  00  5d  00  00  00
 1170    5e  00  00  00  5f  00  00  00 - 60  00  00  00  61  00  00  00
 1180    62  00  00  00  63  00  00  00 - 64  00  00  00  65  00  00  00
 1190    66  00  00  00  67  00  00  00 - 68  00  00  00  69  00  00  00
 11a0    6a  00  00  00  6b  00  00  00 - 6c  00  00  00  6d  00  00  00
 11b0    6e  00  00  00  6f  00  00  00 - 70  00  00  00  71  00  00  00
 11c0    72  00  00  00  73  00  00  00 - 74  00  00  00  75  00  00  00
 11d0    76  00  00  00  77  00  00  00 - 78  00  00  00  79  00  00  00
 11e0    7a  00  00  00  7b  00  00  00 - 7c  00  00  00  7d  00  00  00
 11f0    7e  00  00  00  7f  00  00  00 - 80  00  00  00  81  00  00  00
 1200    82  00  00  00  83  00  00  00 - 84  00  00  00  85  00  00  00
 1210    86  00  00  00  87  00  00  00 - 88  00  00  00  89  00  00  00
 1220    8a  00  00  00  8b  00  00  00 - 8c  00  00  00  8d  00  00  00
 1230    8e  00  00  00  8f  00  00  00 - 90  00  00  00  91  00  00  00
 1240    92  00  00  00  93  00  00  00 - 94  00  00  00  95  00  00  00
 1250    96  00  00  00  97  00  00  00 - 98  00  00  00  99  00  00  00
 1260    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 1270    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 …
 ffe0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 fff0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
  


0


1


2


3


4


5


6


7


8


9

1
0


1


2


3


4


5


6


7


8


9

2
0


1


2


3


4


5


6


7


8


9

3
0


1

Type of scheme

Bdate

Flag

Outdated DocIDs

Reserved1

Number of Hint Pages

Hint page size

Number of DocIDs

Minimum DocID Value

Maximum DocID Value

Number of DocIDs Delta

Reserved2 (2004 bytes)

...

Reserved3 (2048 bytes)

Array of DocIDs (608 bytes)

...

Type of scheme (4 bytes): Set to 01 00 00 00 for Type of Scheme = 1.

Bdate (4 bytes): Set to 05 00 00 00.

Flag (4 bytes): Set to 00 00 00 00.

Outdated DocIDs (4 bytes): Set to 00 00 00 00.

Reserved 1 (4 bytes): Set to 98 00 00 00.

Number of Hint Pages (4 bytes): Set to 00 00 00 00.

Hint page size (4 bytes): Set to 00 00 00 00.

Number of DocIDs (4 bytes): Set to 98 00 00 00.

Minimum DocID Value (4 bytes): Set to 02 00 00 00.

Maximum DocID Value (4 bytes): Set to 99 00 00 00.

Number of DocIDs Delta (4 bytes): Set to 00 00 00 00.

Reserved2 (2004 bytes): Set to all zeros from address 0020 through 0800.

Hint Array (0 bytes): The field is missing.

Reserved3 (2048 bytes): Set to all zeros from address 0800 through 1000.

Array of DocIDs (608 bytes): Array of 152 of document identifiers (1).

The same example in Bitmap Document Set format, as specified in section 2.7.2, 000100006.wid in the example set:

  
 0000    03  00  00  00  05  00  00  00 - 00  00  00  00  00  00  00  00
 0010    98  00  00  00  00  00  00  00 - 00  00  00  00  05  00  00  00
 0020    02  00  00  00  99  00  00  00 - 00  00  00  00  00  00  00  00
 0030    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 0040    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 …
 0fe0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 0ff0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 1000    fc  ff  ff  ff  ff  ff  ff  ff - ff  ff  ff  ff  ff  ff  ff  ff
 1010    ff  ff  ff  03  00  00  00  00 - 00  00  00  00  00  00  00  00
 1020    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 …
 ffe0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00
 fff0    00  00  00  00  00  00  00  00 - 00  00  00  00  00  00  00  00


0


1


2


3


4


5


6


7


8


9

1
0


1


2


3


4


5


6


7


8


9

2
0


1


2


3


4


5


6


7


8


9

3
0


1

Type of scheme

Bdate

Flag

Outdated DocIDs

Number of DocIDs

Reserved1

Reserved2

Size of bitmap

Minimum DocID Value

Maximum DocID Value

Number of DocIDs Delta

Reserved3 (4052 bytes)

...

Bitmap (20 bytes)

Type of scheme (4 bytes): Set to 03 00 00 00 for Type of Scheme = 3.

Bdate (4 bytes): Set to 05 00 00 00.

Flag (4 bytes): Set to 00 00 00 00.

Outdated DocIDs (4 bytes): Set to 00 00 00 00.

Reserved1 (4 bytes): Set to 98 00 00 00.

Reserved2 (4 bytes): Set to 00 00 00 00.

Size of bitmap (4 bytes): Set to 05 00 00 00.

Number of DocIDs (4 bytes): Set to 98 00 00 00.

Minimum DocID Value (4 bytes): Set to 02 00 00 00.

Maximum DocID Value (4 bytes): Set to 99 00 00 00.

Number of DocIDs Delta (4 bytes): Set to 00 00 00 00.

Reserved3 (4052 bytes): Set to all zeros from address 0020 through 1000.

Bitmap (20 bytes): Bits corresponding to document identifiers (1) present in the document set file.