Planejamento do armazenamento de conteúdo corporativo (SharePoint Server 2010)

 

Aplica-se a: SharePoint Server 2010

Tópico modificado em: 2015-03-09

Este artigo descreve como planejar uma solução de armazenamento de conteúdo corporativo que usa o Microsoft SharePoint Server 2010. Embora os exemplos deste artigo sejam relevantes principalmente para soluções baseadas no SharePoint Server 2010, as diretrizes prescritivas apresentadas aqui aplicam-se tanto ao SharePoint Server 2010 quanto ao SharePoint Foundation 2010, exceto se especificado de outra forma.

As informações e diretrizes neste tópico foram escritas como uma introdução aos conceitos de armazenamento de conteúdo corporativo. Determinadas informações deste tópico são derivadas de outros documentos mais detalhados sobre testes de desempenho e capacidade realizados na Microsoft e de outros artigos que apresentam diretrizes detalhadas sobre conceitos específicos. É altamente recomendável usar todos esses recursos ao planejar sua solução de armazenamento de conteúdo corporativo. Para obter mais informações e links, consulte Recursos adicionais mais adiante neste artigo.

Neste artigo:

  • Entendendo o armazenamento de conteúdo corporativo

  • Cenários comuns de gerenciamento de conteúdo em grande escala

  • Níveis de armazenamento: benefícios e limitações

  • Roteando e armazenando conteúdo corporativo com base nos metadados

  • Navegando e filtrando conteúdo corporativo usando metadados

  • Modos de exibição de lista

  • Recursos adicionais

Entendendo o armazenamento de conteúdo corporativo

A solução de gerenciamento de documentos vai além do simples fornecimento de um local para os documentos. Uma solução completa de gerenciamento de documentos de nível empresarial trabalha com armazenamento de documentos em vários níveis, inclusive o armazenamento em conjuntos de sites, sites, bibliotecas e pastas. Ela também permite que as empresas gerenciem com eficácia seus crescentes volumes de documentos corporativos e assegurem que as versões dos documentos de cada estágio do ciclo de vida sejam mantidas para referência ou por motivos legais.

O SharePoint Server 2010 oferece suporte a um armazenamento de documento de alta capacidade. A biblioteca de documentos é capaz de armazenar milhões de documentos. Entretanto, dependendo de como o conteúdo é usado, o desempenho dos sites que incluem muitos documentos pode ser reduzido. A diretriz prescritiva apresentada neste artigo pode ajudá-lo a criar soluções de gerenciamento de conteúdo em grande escala, que se adaptam aos requisitos da sua empresa ao mesmo tempo em que proporcionam aos usuários da solução um ambiente de alto desempenho no qual é possível criar e usar documentos.

As decisões que você toma em relação aos recursos de conjuntos de sites, sites e bibliotecas devem exercer não apenas as restrições de armazenamento físico do ambiente, mas também os padrões dos usuários relacionados ao uso e à exibição do conteúdo. Por exemplo, se os usuários exibirem ou consultarem um conjunto de documentos na biblioteca que inclui milhares de documentos, o desempenho poderá ser reduzido se o site não for configurado corretamente. Se um contrato de nível de serviço exige backup do conteúdo duas vezes por dia, o serviço poderá não ser realizado de forma satisfatória se o conjunto de conteúdo for grande demais.

Cenários comuns de gerenciamento de conteúdo em grande escala

Geralmente, os cenários de gerenciamento de conteúdo em grande escala são variações de um dos seguintes cenários:

  • Ambiente de criação em grande escala

  • Arquivo morto de conteúdo em grande escala

  • Arquivo morto de conteúdo em escala extremamente grande

As descrições dos cenários apresentadas aqui visam esclarecer o significado das soluções em grande escala e mostrar exemplos de alto nível que possam refletir suas metas de gerenciamento de conteúdo. É claro que essas descrições não incluem todos os aspectos de determinado cenário. Há dezenas, até centenas, de aspectos exclusivos relacionados a um cenário específico que estão além do escopo deste artigo.

Ambiente de criação em grande escala

Em um ambiente de criação em grande escala, por exemplo, o site pode incluir uma biblioteca na qual os usuários editam 50.000 ou mais documentos em 500 ou mais pastas. O controle de versão está habilitado e, geralmente, há várias versões de cada documento. É feito check-in e check-out dos documentos frequentemente, e os fluxos de trabalho são usados para controlar seus ciclos de vida. Um banco de dados comum para esse tipo de site contém aproximadamente 150 gigabytes (GB) de dados. É possível usar as configurações da biblioteca para limitar o número de versões salvas, reduzindo o consumo do banco de dados. (Observe que cada versão de um documento é armazenada separadamente no banco de dados.) Normalmente, em um ambiente de criação em grande escala, 80% dos usuários do site são autores que têm acesso às versões principais e secundárias dos documentos, enquanto 20% dos usuários do site têm permissões somente leitura e só podem exibir as versões principais do conteúdo.

O site de ambiente de criação em grande escala pode ser baseado no modelo de site da Central de Documentos do SharePoint Server 2010, que inclui uma única biblioteca grande de documentos otimizada para criação em grande escala.

Arquivo morto de conteúdo em grande escala

Um arquivo morto de conteúdo em grande escala é um repositório de documentos no qual os usuários exibem documentos ou carregam documentos novos. Pouca ou nenhuma criação acontece no site. Há dois cenários principais de arquivo morto de conteúdo em grande escala: base de dados de conhecimento e gerenciamento de registros.

Em um site de base de dados de conhecimento, existe apenas uma única versão de grande parte dos documentos, de forma que a escala do site possa ser ajustada para armazenar com facilidade milhões de documentos (recomendação máxima de 30.000.000 de documentos). O conteúdo é normalmente armazenado em um único banco de dados de até 1 terabyte. Em um cenário comum, como no centro de suporte técnico de uma empresa, 10.000 usuários podem acessar o conteúdo, principalmente para leitura. Um subconjunto de usuários (três ou quatro mil) pode carregar conteúdo novo no site. O site de base de dados de conhecimento pode ser baseado no modelo de site da Central de Documentos.

Outro tipo de arquivo morto de conteúdo em grande escala é a central de registros, com base no modelo de site da Central de Registros. É aconselhável usar o modelo de site da Central de Registros para sites que têm um milhão ou mais documentos. Esse modelo de site inclui recursos que podem ser usados para gerenciar a retenção e disposição dos registros (documentos que servem como evidência de atividades ou transações realizadas pela organização e que devem ser retidos por algum tempo). Da mesma forma que o site de base de dados de conhecimento, a central de registros contém um única versão de cada documento e pode armazenar normalmente milhões de documentos. Muito mais usuários enviam conteúdo à central de registros do que exibem ou leem conteúdo.

Arquivo morto de conteúdo em escala extremamente grande

Um arquivo morto de conteúdo em escala extremamente grande pode ser usado como uma biblioteca ou um repositório de conteúdo de referência. Para fornecer escala além daquela do arquivo morto de conteúdo em grande escala, um arquivo morto de conteúdo em escala muito grande pode incluir 50.000.000 ou mais documentos distribuídos em diversos conjuntos de sites. O conteúdo de cada conjunto de sites pode ser armazenado como dados BLOB (Binary Large Object, objeto binário grande) em vários bancos de dados de conteúdo ou usando o RBS (Remote BLOB Storage, armazenamento de Blob remoto). O RBS permite o armazenamento dos dados fora do SQL Server, oferecendo opções de armazenamento mais acessíveis e reduzindo o tamanho do banco de dados de conteúdo. O SharePoint Search ou o FAST Search para SharePoint é usado para localizar conteúdo em vários conjuntos de sites.

Níveis de armazenamento: benefícios e considerações do armazenamento de conteúdo

Conjuntos de sites

Um conjunto de sites é um grupo de sites que têm o mesmo proprietário e compartilham configurações de administração. Cada conjunto de sites contém um site de nível superior e pode incluir um ou mais subsites. O conjunto de sites geralmente tem uma estrutura de navegação compartilhada.

Os sites de um conjunto de sites são, normalmente, inter-relacionados de propósito. Para aumentar a capacidade de uso da solução, armazene todos os dados e o conteúdo relacionados em um único conjunto de sites. Veja a seguir os benefícios de se fazer isso:

  • Os tipos e as colunas de conteúdo gerenciados no conjunto de sites podem ser compartilhados pelos sites do conjunto de sites. É possível usar o serviço de metadados gerenciados para sindicalizar definições de tipos e colunas de conteúdo em diversos conjuntos de sites.

  • É possível disponibilizar políticas de gerenciamento de informações gerenciadas no conjunto de sites para o conteúdo em todos os sites do conjunto de sites.

  • A pesquisa pode ser usada em todo o conteúdo nos vários conjuntos de sites.

  • Alguns modos de exibição listam documentos de vários sites em um único conjunto de sites (por exemplo, um modo de exibição que enumera todas as tarefas atribuídas a um usuário por todo o conjunto de sites). Além disso, os desenvolvedores podem criar consultas de banco de dados intersites em um conjunto de sites, mas não há suporte para consultas intersite entre vários conjuntos de sites.

  • Cotas de conteúdo e outras cotas só podem ser gerenciadas no nível do conjunto de sites.

Considere os seguintes limites ao planejar como alocar seu conteúdo entre um ou mais conjuntos de sites:

  • Todos os sites em um conjunto de sites compartilham os mesmos recursos de back-end. Em particular, todo o conteúdo de um conjunto de sites deve ser armazenado no mesmo banco de dados de conteúdo. Por causa disso, o desempenho das operações do banco de dados, como backup e restauração de conteúdo, dependerá da quantidade de conteúdo de todo o conjunto de sites, do tamanho do banco de dados, da velocidade dos servidores que hospedam o banco de dados e de outros fatores. Dependendo da quantidade de conteúdo e da configuração do banco de dados, convém segmentar um conjunto de sites em vários conjuntos para atender aos contratos de nível de serviço quanto a backup e restauração, produtividade ou outros requisitos. Está além do escopo deste artigo oferecer diretrizes prescritivas sobre como gerenciar o tamanho e o desempenho dos bancos de dados.

  • Especificamente, mantenha sites muito ativos em conjuntos de sites separados. Por exemplo, um site de base de dados de conhecimento na Internet que permite a navegação anônima pode gerar muita atividade de banco de dados. Se outros sites usarem o mesmo banco de dados, seu desempenho poderá ser afetado. Ao colocar o site de base de dados de conhecimento em um conjunto de sites separado com o seu próprio banco de dados, você pode liberar recursos para outros sites que não terão mais que competir com ele pelos recursos de banco de dados.

Observação

O SharePoint Foundation e o SharePoint Server 2010 incluem diversos recursos que reduzem a necessidade de restauração de conteúdo por parte do departamento de TI. A Lixeira e a Lixeira do Conjunto de Sites dispõem de um mecanismo de segurança dupla para restauração de itens excluídos por engano. O controle de versão de documentos também oferece uma gama de recursos de segurança: se um documento é perdido, pelo menos sua versão anterior estará disponível. Para assegurar da melhor maneira a disponibilidade das versões anteriores, o administrador pode remover a permissão Excluir Versões de um autor; isso pode ajudar a garantir que as versões anteriores do conteúdo fiquem disponíveis sem precisar restaurá-las do banco de dados.

Sites

Um site é a principal maneira de organizar conteúdo relacionado no SharePoint Server 2010 e no SharePoint Foundation.

O armazenamento de conteúdo no mesmo site tem os seguintes benefícios:

  • É mais fácil criar páginas que mostrem modos de exibição de várias bibliotecas e listas quando estão no mesmo site.

  • É possível usar o modelo de site da Central de Documentos para criar um site otimizado para criação e uso de vários documentos.

  • A interface do usuário de navegação no site é otimizada para facilitar a localização das bibliotecas no mesmo site.

  • É possível definir um conjunto de tipos de conteúdo e colunas de site para uso em um site.

Bibliotecas

O armazenamento de conteúdo na mesma biblioteca oferece os seguintes benefícios:

  • Fica mais fácil para os usuários adicionar novos documentos ou encontrar documentos existentes em uma única biblioteca.

  • Muitas configurações de gerenciamento de documentos, como permissões, controle de versão de conteúdo e aprovação, são aplicadas no nível da biblioteca.

  • Modos de exibição criados usando a interface do usuário estão associados a uma determinada biblioteca.

  • Políticas de gerenciamento de informações, como auditoria de conteúdo e configurações de retenção, podem ser aplicadas a uma biblioteca. Para algumas bibliotecas, é possível usar apenas as políticas de retenção.

Considere os limites a seguir quando planejar a organização do conteúdo na mesma biblioteca:

  • Configurações como check-outs obrigatórios ou controle de versão são especificadas no nível da biblioteca de documentos. Se quiser especificar configurações diferentes para outros documentos, coloque esses documentos em uma outra biblioteca com as configurações específicas necessárias.

  • Modos de exibição com colunas que são usadas apenas em um tipo de conteúdo podem não ser úteis, pois nenhum valor de metadados será exibido para os itens de outros tipos de conteúdo.

  • O desempenho do modo de exibição fica limitado quando o número de itens exibidos excede o limite do modo de exibição de lista de 5.000 itens (padrão). Além disso, as consultas são bloqueadas quando excedem o limite do modo de exibição de lista. Organize o conteúdo da biblioteca em pastas com até 5.000 itens ou crie modos de exibição que aproveitem a navegação de metadados e as colunas indexadas para retornar conjuntos de 5.000 ou menos itens.

Pastas

Uma pasta é uma subdivisão nomeada do conteúdo em uma biblioteca semelhante às pastas do sistema de arquivos. O principal objetivo das pastas é organizar o conteúdo de maneira lógica de forma a corresponder à funcionalidade esperada da biblioteca. Por exemplo, se a biblioteca foi criada para fornecer especificações de produto, o conjunto de pastas na biblioteca pode ser nomeado em relação a cada área de recurso no produto ou a cada membro da equipe que elabora as especificações do produto.

Ao dividir o conteúdo entre várias pastas, cada uma com 5.000 (limite padrão do modo de exibição de lista) ou menos itens, os modos de exibição nas pastas podem funcionar bem. Observe que, para aproveitar esse recurso, os modos de exibição disponíveis nas pastas devem ser configurados para mostrar somente os itens que elas contêm (esse recurso está disponível na interface padrão de exibição-criação). Observe também que, se as pastas tiverem 5.000 ou menos itens, os modos de exibição nas pastas não terão que ser filtrados usando colunas indexadas. Para pastas com mais de 5.000 itens, é possível melhorar o desempenho usando a navegação de metadados e/ou as colunas indexadas e, em seguida, filtrar os modos de exibição para retornar menos de 5.000 itens.

Considere a criação de pastas como parte da solução de armazenamento e roteamento de conteúdo com base em metadados. Usando o Organizador de Conteúdo, é possível definir configurações que criem automaticamente as pastas quando uma pasta de destino ficar muito grande ou para cada valor de propriedade de metadados. Para obter mais informações, consulte Roteando e armazenando conteúdo corporativo com base em metadados, mais adiante neste artigo.

Roteando e armazenando conteúdo corporativo com base em metadados

O SharePoint Server 2010 introduz o roteamento e o armazenamento de metadados com o uso do Organizador de Conteúdo. Usando o Organizador de Conteúdo, novos recursos no nível do site tornam mais fácil para os administradores e usuários classificar, rotear e armazenar conteúdo por meio de regras baseadas em metadados.

Com base nos metadados de um documento, o Organizador de Conteúdo é capaz de rotear um documento para uma pasta especificada ou criar automaticamente uma nova pasta. É possível criar pastas como filhos da pasta de destino porque o número de itens na pasta de destino excede o limite especificado ou novas pastas para cada valor novo em um campo. As novas pastas herdarão configurações da pasta pai. As novas pastas também podem ter regras adicionais que definem outros parâmetros, como permissões, metadados adicionais, políticas de retenção e fluxos de trabalho que serão herdados pelos documentos contidos.

Para obter mais informações, consulte Visão geral de roteamento e armazenamento baseados em metadados (SharePoint Server 2010).

A Filtragem e Navegação de Metadados é um novo recurso no SharePoint Server 2010 que permite aos usuários filtrar e encontrar conteúdo por meio de metadados. Esse recurso inclui uma interface do usuário simples que se baseia no controle de hierarquia do modo de exibição de Árvore do SharePoint, combinando-o com um novo controle Filtros Principais, para fornecer aos usuários uma ferramenta avançada de localização de conteúdo com base em metadados.

Os proprietários de listas podem configurar as definições de navegação de metadados, que promove campos em uma lista como campos de navegação principais. Os usuários que exibirem essas listas poderão filtrar ainda mais o atual modo de exibição de lista para mostrar somente os itens com os valores desejados nesses campos.

Os recursos de indexação automática podem criar automaticamente índices de lista, dependendo dos campos promovidos como campos de navegação da lista. A indexação automática pode melhorar os resultados de consulta e aprimorar o desempenho.

Para obter mais informações sobre como integrar a navegação de metadados à solução de armazenamento de conteúdo corporativo, consulte Visão geral da navegação de metadados (SharePoint Server 2010).

Modos de exibição de lista

A essência de toda solução de gerenciamento de conteúdo corporativo é a capacidade dada aos usuários de pesquisar facilmente e encontrar o conteúdo que estão procurando. Ao se moverem pela biblioteca ou pasta, os modos de exibição de árvore e de lista oferecem uma interface simples para que os usuários naveguem visualmente pela taxonomia de armazenamento de conteúdo. Ao mesmo tempo, quando a biblioteca ou pasta inclui muitos itens, a capacidade da lista de consultar e exibir rapidamente os resultados pode exigir recursos de sistema consideráveis. O SharePoint Server 2010 pode maximizar o desempenho do modo de exibição de lista ao mesmo tempo em que minimiza o consumo de recursos do sistema, através da Limitação de Recurso. As propriedades da Limitação de Recurso são definidas no aplicativo Web, em Configurações Gerais na Administração Central, e afetam os recursos alocados para consulta e exibição de listas nesse aplicativo Web.

A configuração do armazenamento de forma a não exceder o limite do modo de exibição de lista quando você exibe o conteúdo de uma biblioteca ou pasta evita a limitação de recurso e aumenta o desempenho do modo de exibição de lista.

A Limitação de Recurso inclui as seguintes propriedades relacionadas ao desempenho do modo de exibição de lista:

Propriedade Descrição Valor padrão

Limite do Modo de Exibição de Lista

O número máximo de itens na lista ou biblioteca que uma operação de banco de dados, como a consulta, é capaz de processar de uma única vez, fora da janela de tempo diária definida pelo administrador durante a qual as consultas são irrestritas. É aconselhável não alterar a configuração dessa propriedade.

5000

Substituição de Modelo de Objeto

Especifica aos usuários com permissão especial a capacidade de substituir o Limite do Modo de Exibição de Lista programaticamente para determinadas consultas.

Sim

Limite do Modo de Exibição de Lista para Auditores e Administradores

O número máximo de itens na lista ou biblioteca que uma operação de banco de dados, como a consulta, é capaz de processar de uma única vez quando é feita por um auditor ou administrador com as permissões apropriadas. Essa configuração funciona em conjunto com Permitir Substituição do Modelo do Objeto.

20.000

Limite de Pesquisa de Modo de Exibição de Lista

O número máximo de junções permitidas por consulta, como aquelas baseadas em pesquisa, Pessoa/Grupo ou colunas de status do fluxo de trabalho. Se a consulta usar mais de oito junções, a operação será bloqueada. Isso não se aplica a operações de item único. Quando você usa o modo de exibição máximo via OM (sem especificar nenhum campo de modo de exibição), o SharePoint retorna até as primeiras oito pesquisas. É aconselhável não alterar a configuração dessa propriedade.

8

Janela de Tempo Diária para Consultas Grandes

Um período no qual as consultas grandes podem ser executadas. O período deve ser definido fora do horário de trabalho regular, pois consultas grandes podem gerar excesso de carga no servidor.

Desabilitado

Recursos adicionais

Além das informações neste artigo, os recursos a seguir podem ajudá-lo a entender e a planejar a solução de armazenamento de conteúdo corporativo.