Edición de un archivo de sinónimos (Office SharePoint Server)

Un archivo de sinónimos es una característica de búsqueda de expansión de consulta de Microsoft Office SharePoint Server 2007 que permite a los usuarios escribir una frase en un cuadro de búsqueda y recibir los resultados para palabras que están relacionadas con la frase que se ha especificado. Por ejemplo, una búsqueda de la palabra "ejecutar" puede devolver resultados que contengan tanto la palabra "ejecutar" como "fusilar" si los dos términos están relacionados en el archivo de sinónimos. En un archivo de sinónimos, se usan conjuntos de reemplazo para especificar modelos que se reemplazan por valores alternativos; y se usan conjuntos de expansión para devolver valores adicionales que son sinónimos del modelo especificado.

En este artículo:

  • Descripción de archivos de sinónimos

  • Uso de conjuntos de reemplazo

  • Uso de conjuntos de expansión

  • Edición de un archivo de sinónimos

  • Lista de archivos de sinónimos por idioma

Descripción de archivos de sinónimos

Cuando se instala Microsoft Office SharePoint Server 2007, se incluye automáticamente un archivo de sinónimos para cada uno de los idiomas admitidos por Office SharePoint Server 2007, junto con un archivo de sinónimos neutro, tsneu.xml. El archivo de sinónimos neutro tsneu.xml se aplica a las consultas que no tienen un archivo de sinónimos asociado con el idioma de la consulta. El archivo de sinónimos neutro siempre se aplica a las consultas, incluso cuando hay un archivo de sinónimos específico asociado con el idioma de la consulta. Para obtener más información, vea la sección "Lista de archivos de sinónimos por idioma".

De forma predeterminada, los archivos de sinónimos se crean y almacenan en la siguiente ubicación en el servidor de consultas: Unidad:\Archivos de programa\Microsoft Office Servers\12.0\Data\Config. Los archivos de sinónimos se copian desde esa ubicación predeterminada a la siguiente ubicación de carpeta para cada instancia del servicio Microsoft Search que exista en el servidor de consultas: Unidad:\Archivos de programa\Microsoft Office Servers\12.0\Data\Office Server\Applications\<UID de la aplicación>\Config, donde <UID de la aplicación> es el GUID asociado con un determinado proveedor de servicios compartidos.

Nota

Si modifica los archivos de sinónimos en la ubicación predeterminada, la versión modificada de los archivos se copiará automáticamente cada vez que se cree un nuevo proveedor de servicios compartidos (SSP). Si modifica los archivos de sinónimos en la ubicación predeterminada después de la creación de un SSP, será necesario copiar los archivos desde la ubicación predeterminada al directorio especificado para cada uno de los SSP que ya existen.

Importante

Un archivo denominado tsschema.xml se instala en el mismo directorio con los archivos de sinónimos. No modifique el archivo tsschema.xml. Todos los demás archivos de sinónimos hacen referencia a este archivo y la modificación de este archivo puede producir que la búsqueda no funcione correctamente.

De forma predeterminada, cada archivo de sinónimos incluye contenido de ejemplo inactivo. Debe editar un archivo de sinónimos para que la búsqueda pueda usarlo. Los archivos de sinónimos contienen dos tipos principales de entradas: conjuntos de reemplazo y conjuntos de expansión. Estas entradas se describirán con más detalle en secciones posteriores de este tema. Un tercer tipo de entrada, distinción de signos diacríticos, se usa para especificar si la búsqueda deberá omitir o respetar los signos diacríticos, como los acentos. De forma predeterminada, los signos diacríticos se omiten, por lo que el valor se establece en 0. Para que la búsqueda respete los signos diacríticos, cambie el valor a 1.

A continuación, se muestra un ejemplo del código XML predeterminado en un archivo de sinónimos:

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE5</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>run</sub>
            <sub>jog</sub>
        </expansion>
    </thesaurus>
-->
</XML>

Importante

Desde la perspectiva del rendimiento, es importante ser consciente de cuántos elementos hay definidos en el archivo de sinónimos y no superar los 1.000/10.000 (valor típico/valor máximo) elementos. Tenga en cuenta que cada etiqueta <pat> o <sub> cuenta como un elemento definido que va en contra de los valores recomendados.

Las entradas que agregue al archivo de sinónimos no pueden contener sólo caracteres especiales. Sin embargo, puede haber entradas en blanco. Por ejemplo, si desea asegurarse de que las consultas para un término específico no devuelvan ningún resultado, cambie la entrada. En el ejemplo siguiente, las consultas para el término "windows" no devolverán ningún resultado:

<replacement>
    <pat>windows</pat>
    <sub></sub>
</replacement>

Se pueden incluir palabras irrelevantes en un archivo de sinónimos; sin embargo, dichas palabras se filtrarán en una etapa posterior si también usa un archivo de palabras irrelevantes. Para obtener más información, vea Edición de un archivo de palabras irrelevantes (Office SharePoint Server).

Uso de conjuntos de reemplazo

Un conjunto de reemplazo especifica un modelo que se reemplaza por una o más sustituciones en una consulta de búsqueda. Por ejemplo, puede agregar un conjunto de reemplazo en el que "W2K" es el modelo y "Windows 2000" es la sustitución. En una consulta del término "W2K", Office SharePoint Server 2007 devolverá sólo los resultados de búsqueda que contienen el término "Windows 2000". Los resultados de la búsqueda no devolverán elementos que contengan el término "W2K".

Cada conjunto de reemplazo se escribe dentro de una etiqueta <replacement>. Dentro de la etiqueta de reemplazo, especifique uno o más modelos escribiéndolos en una etiqueta <pat> y especifique una o más sustituciones escribiéndolas en una etiqueta <sub>. Los modelos y sustituciones pueden contener una palabra o una secuencia de palabras. Por ejemplo, para agregar un conjunto de reemplazo donde "W2K" sea el modelo y "Windows 2000" la sustitución, use lo siguiente:

<replacement>
    <pat>W2K</pat>
    <sub>Windows 2000</sub>
</replacement>

Puede tener más de una sustitución para cada modelo que especifique.

Nota

Lo ideal sería que los conjuntos de reemplazo se usen con términos que todo el mundo entienda como iguales. Por ejemplo, considere el escenario donde un término obsoleto, como puede ser un nombre interno de producto, deba reemplazarse por otro término en una consulta, como es el nombre final del producto.

Uso de conjuntos de expansión

Un conjunto de expansión es un grupo de sustituciones que son sinónimos entre sí. Las consultas que contienen coincidencias de una sustitución se expanden para incluir todas las demás sustituciones del conjunto de expansión. Por ejemplo, puede agregar un conjunto de expansión donde las siguientes sustituciones sean sinónimos:

  • escritor

  • autor

  • periodista

Si realiza una consulta del término "autor", Office SharePoint Server 2007 también devuelve resultados de búsqueda que contienen el término "escritor" y el término "periodista".

Cada conjunto de expansión se escribe dentro de una etiqueta <expansion>. Dentro de la etiqueta <expansion>, especifique una o más sustituciones escribiéndolas dentro de una etiqueta <sub>. Por ejemplo, en el ejemplo anterior, agregue las siguientes líneas:

<expansion>
    <sub>writer</sub>
    <sub>author</sub>
    <sub>journalist</sub>
</expansion>

Puede incluir palabras individuales o frases en un archivo de sinónimos. El separador de palabras para un idioma especificado identifica las palabras individuales al determinar los límites de las palabras según las reglas léxicas del idioma. Si incluye una palabra en un archivo de sinónimos que el separador de palabras no reconoce como una sola palabra, también debería incluir la palabra en un diccionario personalizado para que el separador de palabras no separe la palabra en tokens más pequeños. Por ejemplo, si usa la palabra “IT&T” en un conjunto de expansión, pero no la incluye en un diccionario personalizado, el separador de palabras podría separar la palabra en dos palabras distintas, “IT” y “T”. Esto puede producir que el conjunto de expansión no funcione del modo esperado cuando se lleve a cabo una consulta de búsqueda. Para obtener información acerca de la creación y el uso de diccionarios personalizados, vea Creación de un diccionario personalizado (Office SharePoint Server 2007).

Edición de un archivo de sinónimos

Realice el siguiente procedimiento para editar un archivo de sinónimos.

Importante

Al editar un archivo, debe haber el mismo número de etiquetas de apertura que de cierre alrededor de cada entrada del archivo. Si las etiquetas XML del archivo de sinónimos no coinciden, se registrará un error en el registro de eventos de la aplicación.

Edición de un archivo de sinónimos

  1. Inicie el Bloc de notas y, a continuación, abra un archivo de sinónimos. Para obtener información acerca de la búsqueda e identificación del archivo de sinónimos correspondiente, vea la sección "Descripción de archivos de sinónimos".

  2. Si va a cambiar el archivo de sinónimos por primera vez, quite la línea de comentario <!-- Commented out que aparece al principio del archivo y la línea de comentario --> que aparece al final del archivo.

  3. Realice los cambios en el archivo de sinónimos. Agregue, modifique o elimine un conjunto de reemplazo o un conjunto de expansión.

  4. Guarde el archivo de sinónimos y, a continuación, cierre el Bloc de notas.

Lista de archivos de sinónimos por idioma

Idioma Nombre de archivo

Árabe

tsara.xml

Bengalí

tsben.xml

Búlgaro

tsbul.xml

Catalán

tscat.xml

Chino (simplificado)

tschs.xml

Chino (tradicional)

tscht.xml

Croata

tscro.xml

Neerlandés (Países Bajos)

tsnld.xml

Inglés (Reino Unido)

tseng.xml

Inglés (Estados Unidos)

tsenu.xml

Finés

tsfin.xml

Francés

tsfra.xml

Alemán

tsdeu.xml

Gujaratí

tsguj.xml

Hebreo

tsheb.xml

Hindi

tshin.xml

Islandés

tsice.xml

Indonesio

tsind.xml

Italiano

tsita.xml

Japonés

tsjpn.xml

Canarés

tskan.xml

Coreano

tskor.xml

Letón

tslat.xml

Lituano

tslit.xml

Malayo

tsmal.xml

Malayalam

tsmly.xml

Marathi

tsma.xml

Idioma neutral

tsneu.xml

Noruego (Bokmaal)

tsnor.xml

Polaco

tsplk.xml

Polaco

tspol.xml

Portugués (Brasil)

tsptb.xml

Portugués (Portugal)

tspor.xml

Punyabí

tspun.xml

Rumano

tsrom.xml

Ruso

tsrus.xml

Serbio (cirílico)

tssbc.xml

Serbio (latino)

tssbl.xml

Eslovaco

tssvk.xml

Esloveno

tsslo.xml

Español

tsesn.xml

Sueco

tssve.xml

Tamil

tstam.xml

Telugu

tstel.xml

Tailandés

tstha.xml

Turco

tstur.xml

Ucraniano

tsukr.xml

Urdu (Pakistán)

tsurd.xml