Compartir a través de


Microsoft SharePoint 2010: Agilización de SharePoint con RBS

Almacenamiento remoto BLOB (RBS) puede mejorar el rendimiento y la funcionalidad de SharePoint.

Iqbal Khan

Organizaciones de todos los tamaños utilizan Microsoft SharePoint como un sistema de repositorio, entre otras cosas y administración de documentos. Como resultado, SharePoint es almacenar una gran cantidad de documentos, con números, a menudo alcanzando los millones.

SharePoint guarda todos estos documentos en la base de datos de SQL Server como objetos binarios grandes (BLOB). Como otras bases de datos relacionales, SQL Server no se diseñó para almacenar BLOB de esta magnitud. Como resultado, puede ahogar a diversos niveles. Esto reduce el rendimiento de SharePoint y hace dolorosa la administración de base de datos.

Para solucionar este problema, Microsoft introdujo un modelo de proveedor de almacenamiento de BLOB externa basada en COM (EBS) en SharePoint 2007. EBS permite descargar BLOBs al almacenamiento de información externo y reducir considerablemente el tamaño de la base de datos. Esto resuelve el problema de tamaño de base de datos, pero no tener un nativo.NET proveedor había sobrecarga de rendimiento y no era una "integración limpia" con SharePoint. Por lo tanto, esta solución realmente no era considerada completa.

En SharePoint 2010 y SQL Server 2008 R2, Microsoft lanzó a un nativo.NET basadas en la interfaz de Remote BLOB Storage (RBS) como reemplazo de EBS. RBS también ayuda a reducir considerablemente el tamaño de base de datos de SharePoint 2010. Lo hace mediante la descarga de todos los BLOBs desde la base de datos de contenido de SharePoint en un almacenamiento externo especificado por el usuario. Wikipedia: Esbozo y metadatos para estos BLOBs aún se conservan en la base de datos de contenido. Como resultado, SharePoint todavía piensa que estos BLOBs son parte de SharePoint y puedan acceder a ellos del mismo modo. Los usuarios no sienten ninguna diferencia porque todos BLOBs aún lógicamente forman parte de la base de datos de contenido.

Ahora, Microsoft ha proporcionado una implementación predeterminada llamada Filestream RBS. Sin embargo, esto es bastante básica y no ofrece mucha flexibilidad para los usuarios de SharePoint graves. Aunque descarga BLOBs, no permite especificar filtros para los BLOBs quitarse de encima y cuáles para mantener en la base de datos. Terminas descarga BLOBs todos si quiere o no. Además, no le permiten especificar una ubicación de almacenamiento remoto y almacena BLOBs sólo en un almacenamiento local en el equipo de SQL Server. También tiene herramientas de supervisión ni administración.

Si eres un usuario de SharePoint medianamente grave, querrás mucho más control y flexibilidad sobre almacenamiento y manipulación de BLOB. Hay algunas implementaciones de terceros bastante decentes de RBS que funcionan perfectamente bien y abordar cuestiones de tamaño de base de datos de SharePoint. Necesitará cualquier aplicación de terceros que utiliza sea 100% nativo.NET y no un mosaico de Java y.NET, que puede causar problemas de compatibilidad.

Una de las ventajas del modelo de proveedor RBS es cómo ha abierto SharePoint para los proveedores de terceros añadir más características a través de sus implementaciones de RBS. Nadie implementar un proveedor RBS tiene control sobre donde se almacenan los BLOBs. Puede utilizar este control para dar a los usuarios de SharePoint más características relacionadas con el BLOB más allá de reducir el tamaño de la base de datos y aumentar el rendimiento. En este sentido, existen cuatro áreas principales de mejoras de SharePoint:

  • Reducir los costos de almacenamiento de información a través de varios niveles almacenamiento BLOB
  • Retener BLOBs para fines de cumplimiento de normas y archiving
  • Bibliotecas de documentos de SharePoint no vinculación a SharePoint
  • Incorporar en la memoria caché de BLOB

Almacenamiento de varios niveles

Uno de los principales beneficios de RBS es la capacidad para almacenar BLOB en múltiples niveles de almacenamiento de información en lugar de todos en una sola ubicación. Esto ayuda a reducir significativamente los costos de almacenamiento. Sin RBS, casi todos se mantiene en la base de datos SQL Server. Incluso de RBS de Filestream utiliza SQL Server para el almacenamiento BLOB. Este único punto de almacenamiento generalmente es algo bastante costoso, como un disco de SAN/NAS.

BLOB normalmente constituyen alrededor del 90 por ciento de todos los datos de SharePoint, y usted no necesita frecuente acceso a todos ellos. Así que cuando todos los BLOBs se almacenan en un arreglo de discos SAN/NAS caro a pesar de que sólo requieren referencias frecuentes, terminas mucho el gasto en almacenamiento de información que se utiliza de manera ineficiente.

Una estrategia más razonable sería almacenar únicamente los documentos nuevos y activos (BLOBs) en almacenamiento de información costoso porque los usuarios tendrán acceso a aquellos con más frecuencia y rápidamente. Puede almacenar el resto de los BLOBs anteriores y menos frecuentes en los niveles de almacenamiento más baratos. Esto significa que no necesita grandes cantidades de almacenamiento de información costoso. Puede reducir la cantidad de capacidad de almacenamiento de información costoso y utilizar almacenamiento menos costoso para manejar el resto de la carga de almacenamiento de información.

Un ejemplo de almacenamiento de varios niveles es donde tienes nuevos documentos activos almacenados en un disco de SAN caro. Entonces usted tiene un servidor de archivos normal como el segundo nivel y nube de almacenamiento para el tercer nivel. SAN es el más rápido y más caro. Nube es el más lento y el más barato y un servidor de archivos está en algún lugar entre. Como resultado, ha reducido el costo de almacenamiento de información general. Ahora tanto como 80 por ciento a 85 por ciento de sus BLOBs ya no se mantienen en almacenamiento SAN caro. No necesitan frecuentes acceso y por lo tanto no necesita almacenamiento de alta disponibilidad y alta performance como SAN.

Ahora que tiene almacenamiento de varios niveles, la siguiente pregunta es cómo determinar qué BLOBs para almacenar en los niveles de almacenamiento. Para determinarlo en varios puntos en función de criterios inteligentes. Determinar un BLOB de ubicación cuando es el primero creado (o, de forma similar, cuando primero se descarga desde la base de datos SQL Server). Entonces puede comprobar periódicamente y determinar cómo se ha convertido en viejo un BLOB y con qué frecuencia se utiliza.

Esto es donde algunos proveedores RBS te dan la opción de filtros BLOB. Normalmente hay uno o más filtros BLOB asociados con un nivel de almacenamiento de información. Estos indican que sólo BLOBs estos filtros coincidentes deben almacenarse en un nivel de almacenamiento de información particular. Todos otros BLOBs deben evaluados contra otros niveles de almacenamiento y almacenados donde el BLOB correspondiente filtros de coincidencia.

Si un BLOB no coincide con los filtros BLOB de cualquier nivel almacenamiento de información, a continuación, puede guardarla en la base de datos de contenido de SQL Server. BLOB filtros suelen incluyan nombre del documento, tipo incluso contenido, autor, tamaño y edad. Puede basar estos filtros en etiquetas meta personalizadas que haya agregado o en tipo de archivo (como autores, artista, álbum, etc.).

Algunos proveedores RBS permiten cambiar los filtros de almacenamiento BLOB existente. Ellos automáticamente reajustar los BLOBs y moverlos desde un nivel de almacenamiento de información a otro basado en los nuevos filtros BLOB. Otros proveedores RBS evaluación sólo filtros BLOB en el momento de la creación.

Para el control periódico, algunos proveedores RBS utilizan edad-, basado en uso o en versión archivado. Una tarea de SharePoint se ejecuta en segundo plano y inspecciona todos los BLOBs para patrón de uso, la versión y la edad. Aunque la información de versión y edad se mantiene dentro de la base de datos de contenido de SharePoint, información de uso del patrón es mantenida por el proveedor RBS en tablas separadas o en una base de datos.

Si cualquier edad BLOB o documento de repente se vuelve popular y requiere acceso más frecuente, algunos (no todos) de estos RBS proveedores moverá automáticamente el BLOB volver más costoso almacenamiento de información basado en el uso. De este modo, no perderás nada en el rendimiento. El más caro el almacenamiento de información es, más rápido su tiempo de respuesta. Normalmente, es menos costoso el almacenamiento de información, más lento será el tiempo de respuesta.

Archiving de BLOB

Otro factor importante es la capacidad de archivar y conservar ciertos documentos y objetos binarios en un archivo separado por un período determinado y luego tenerlos elimina automáticamente de SharePoint.

Archiving BLOBs para fines de cumplimiento garantiza que no accidentalmente está eliminados desde SharePoint por cualquier usuario. Muchos proveedores de RBS no tienen retención BLOB. Utilizan el palabra "archivo de" significa mover BLOBs de nivel de almacenamiento de uno a otro. Pero algunos proveedores RBS tienen características de retención BLOB.

En muchas situaciones, tendrás documentos deben conservar durante un período determinado de tiempo o jurídicas o razones de cumplimiento de normas de política de la compañía. Por ejemplo, muchas industrias preservar contratos y acuerdos para un período de cinco años. Dicho cumplimiento es popular en financieras, seguros y de otras industrias similares. Sin embargo, esto podría aplicar a casi cualquier empresa.

En estas situaciones de cumplimiento de normas, debe tener una forma de mantener una copia del documento por separado. De este modo, incluso si se elimina de SharePoint, puede restaurarlo desde el archivo de retención. Incluso si un usuario intenta eliminar un documento de ese tipo, tienes una copia conservada durante varios años por razones de política de empresa o de cumplimiento legal.

Puede haber otras razones de cumplimiento de normas que requieren la eliminación automática de determinados documentos tras un determinado período de tiempo. Por ejemplo, puede ser información financiera que no desea conservar por razones legales. Esos documentos pueden eliminarse automáticamente basado en las normas vigentes.

Cualquier proveedor RBS que proporciona retención de archiving permite especificar separar almacenamiento, que es un archivo principalmente de retención de documentos. Este archivo está fuera de línea para todas las operaciones regulares de SharePoint. Sin embargo, no es realmente sin conexión, sino más bien protegida de acceso regular. Sólo el administrador de SharePoint puede acceder tal un contenedor de retención.

Ahora, no quieres poner todos los documentos de SharePoint en un contenedor de retención. Es por eso un buen proveedor RBS debería darle la capacidad de especificar filtros para los documentos en archivo de retención. Estos filtros podrían basarse en el nombre del documento, extensión del documento, tamaño del documento, tipo de contenido, propiedad del usuario y más. La idea es darle control real sobre la especificación de los documentos que desea archivar.

Bibliotecas de documentos no de SharePoint

Bibliotecas de documentos de SharePoint no puede estar prácticamente cualquier variedad: desde un recurso compartido de archivos simples a otros sistemas de administración de documentos. Puede vincular eficientemente estos documentos en SharePoint. El Rastreador de SharePoint indexa, permitiéndole y otros usuarios de SharePoint buscar, localizar, abrir, leen y edición cualquier documento.

Normalmente, esta capacidad no existe en SharePoint. Por tener un proveedor RBS, inmediatamente tienes esta capacidad Turbo donde puede utilizar SharePoint para compartir y acceder a documentos que no sean documentos de SharePoint.

En la mayoría de las empresas mediana y grande, SharePoint no es el único sistema de administración de documentos. Incluso si algunos departamentos o divisiones mover a SharePoint, todo el mundo no mover a la vez. Vas a tener una situación donde hay documentos en varios otros sistemas de administración de documentos, y los propietarios de dichos sistemas de gestión de documentos aún no preparados mover todo a SharePoint.

Los usuarios de SharePoint le encantaría poder tener acceso a los documentos de SharePoint. La alternativa es que los usuarios de SharePoint iniciar sesión por separado cada sistema de administración de documentos, buscar los documentos, abrir para editar y independientemente check in y out.  Esto es altamente inconveniente, por lo menos.

Una manera más conveniente es tener todo accesible desde dentro de SharePoint. Incluso si los documentos son propiedad de otro sistema de administración de documentos, puede acceder a ellos con SharePoint. Proveedores de RBS realizan esta operación por engañar a SharePoint en pensando estos externos o bibliotecas de documentos de SharePoint no forman parte de SharePoint.

Proveedores de RBS le permiten especificar la ubicación de estas bibliotecas de documentos externos. A continuación, repetir estos documentos y crear los metadatos de cada documento en SharePoint. Proveedores de RBS realice SharePoint creo que se trata de documentos de SharePoint, pero se almacena el documento real de BLOB en almacenamiento de información externo.

Cuando el Rastreador de SharePoint indexa todos los documentos basados en palabras clave, también encuentra estos documentos como documentos de SharePoint normales (en cuanto se refiere a los metadatos). Es por eso el Rastreador puede indexar como todos los demás documentos de SharePoint.

Cuando los usuarios de SharePoint búsquedas dentro de SharePoint, se encuentran estos documentos así. Los usuarios de SharePoint pueden abrir los documentos para leer o modificar y, a continuación, pueden comprobar ellos volver. Lo no cuenta es que cuando comprueban, se almacena el documento actualizado a la ubicación original — esas bibliotecas de documentos SharePoint no o externo.

Los cambios también están disponibles para otros sistemas de administración de documentos porque el proveedor RBS había guarda los cambios en la ubicación de origen. Es capaz de hacer esto porque el proveedor RBS mantiene información adicional alrededor de todos los documentos de SharePoint no por lo que sabe qué hacer con ellos. Estas bibliotecas de documentos pueden ser un recurso compartido de archivos, una base de datos o cualquier almacenamiento de información personalizada.

Un buen proveedor RBS le permite implementar almacenamiento de información personalizada conectable de estos documentos no SharePoint. Si ya dispone de un sistema de gestión de documentos personalizados que almacena todos los documentos en una base de datos Oracle y sabe el esquema de la base de datos, puede implementar un plug-in para este almacenamiento externo personalizado.

Implementar un complemento personalizado normalmente implica escribir algunos.NET código y registrar su.NET Asamblea con servidores de SharePoint Web front-end (WFE). Este plug-in da SharePoint la posibilidad de recorrer en almacenamiento, retirar y registrar documentos y obtener documentos para lectura.

En la memoria caché de BLOB

Proveedores de RBS también pueden incorporar en la memoria caché de BLOB. Siempre BLOBs se recuperan desde la base de datos de contenido, base de datos SQL Server o almacenamiento BLOB incluso externos, está en caché en el servidor de WFE en memoria caché. La próxima vez que un usuario quiere el mismo documento, puede recuperarlo de este en memoria caché. Esto es muchas veces más rápido que va al almacenamiento BLOB. Almacenamiento en caché es posible por los proveedores RBS que están controlando los BLOBs.

Una vez que tienes en la memoria caché enchufado, usted puede almacenar en caché BLOBs, listas de SharePoint y ViewState, así como la aplicación ASP.NET Session State que SharePoint utiliza a veces. Almacenamiento en caché de listas y BLOBs significativamente aumenta su tiempo de respuesta porque SharePoint ya no es hacer estos viajes de almacenamiento de base de datos o datos caros. Almacenamiento en caché de ViewState reduce la carga devuelta por servidores WFE en tu navegador. Esto reduce el consumo de ancho de banda y también mejora el tiempo de respuesta de SharePoint, especialmente si los usuarios tienen acceso a SharePoint a través de la WAN. Almacenamiento en caché de estado de sesión le permite replicar Estados de sesión y evitar la pérdida de datos, además de mejorar el rendimiento y la escalabilidad.

Almacenamiento en caché también mejora la escalabilidad. Con la memoria caché, como agregar más usuarios, rendimiento sigue siendo alta. De lo contrario no es el caso. SharePoint es una aplicación de base de datos intensivos. Hace tantos viajes de base de datos a medida que aumenta el número de usuarios, aumenta la carga de la base de datos.

SharePoint es una plataforma muy valiosa. No es perfecto, pero es ciertamente abierta a mejora. RBS fue originalmente pensado sólo para ayudar a reducir el tamaño de la base de datos y mejorar el rendimiento de SharePoint. Sin embargo, se ha abierto las puertas para un montón de innovación.

Iqbal Khan

**Iqbal Khan**es el Evangelista de tecnología y Presidente de Alachisoft (alachisoft.com). Alachisoft proporciona NCachePoint y NCache. NCachePoint es producto de escalabilidad y rendimiento de SharePoint de líder de la industria, y NCache es un popular.NET distribuido caché. Se puede llegar a Khan en iqbal@alachisoft.com.

Contenido relacionado