Objetivo: Compreender principais conceitos para dimensionamento de sistemas e equipes
Dimensionar força de trabalho significa precisar a capacidade de um sistema composto por pessoas e recursos para atender um padrão de demanda de carga de trabalho, desempenho, recursos e restrições.
No ciclo de gestão, de empresas e negócios, uma vez que o forecast (previsão de demanda) tenha sido estimada adequadamente, ou seja a previsão de carga de trabalho esteja completa, o próximo passo na gestão é determinar a quantidade de pessoas e outros recursos que serão necessários.
Obter a quantidade certa de pessoas e recursos é uma das funções mais importantes em qualquer empresa!
Quantidades excessivas de recursos geram maiores custos e diminuição do retorno do investimento, enquanto a carência de recursos implica queda de qualidade e insatisfação de clientes, consumidores e colaboradores.
Veremos alguns conceitos de dimensionamento e implicações nos principais indicadores de desempenho.
Dimensionar é quantificar recursos .. sistemas, materiais, pessoas, ferramentas, conhecimentos e habilidades, que serão necessários para um determinado serviço a ser prestado
Daremos ênfase aqui à questão de recursos humanos.
O dimensionamento de recursos é um fator crítico em muitos modelos de negócios incluindo especialmentes aqueles baseados em …
- Alta aleatoriedade da demanda.
- Redes de servidores, pessoas, fontes de informação.
- Contact centers.
- Redes de comunicação.
- Compartilhamento de recursos
- Informações.
- SaaS – Softwares como serviços baseado em núvens.
Quando a demanda varia o tempo todo de forma aleatória, é necessário um processo de gestão do planejamento, desempenho, controle e ajustes em tempo real para adequar o dimensionamento de equipes à carga de trabalho.
Uma regra fundamental deve existir: dimensionar mais horas de equipe disponível do que quantidade real de trabalho requerida.
A quantidade da equipe a ser alocada dependerá da carga de trabalho, do nível de serviço e a velocidade de resposta desejada pela empresa, para atrair clientes, minimizar o tempo de espera de usuários e evitar o abandono da fila de espera.
O fator chave para alcançar objetivos de níveis de serviço e tempo de resposta é ter pessoas certas nos lugares certos no tempo certo, suportados por recursos de sistemas certos.
Para que isso seja alcançado é necessário usar:
1) Metodologias certas para o cálculo de recursos, e
2) Entendimento claro do processo de cálculo de dimensionamento e seus impactos na fila de espera, no nível de serviço e na distribuição de carga de trabalho que os recursos (pessoas, equipamentos, canais de serviços, etc) associados irão suportar.
Equipes, Recursos e Tempos devem ser calculados ao mesmo tempo e não existe uma razão fixa entre eles.
Para cada operação, tipo de serviço, modelo de negócio e situações, os tempos envolvidos no TMA e nas filas são diferentes, assim como a tolerância à fila por parte dos usuários.
Em decorrência, os objetivos de níveis de serviço podem ser diferentes e o dimensionamento será diferente.
A relação entre Dimensionamento de Pessoas Recursos Físicos
As seguintes definições e conceitos são insumos para entender a relação entre dimensionamento de pesoas e outros recursos como rede de comunicação, servidores, máquinas, ferramentas.
Retardo (TME – TEMPO MÉDIO de ESPERA: é todo o tempo transcorrido entre a tomada de um recursos até o momento da tomada de um agente de serviço.
Carga de trabalho de agente: inclui os dois componentes do tempo de tratamento de serviço = front office + backoffice (organização do ambiente e entrada de dados e informações).
Carga do recurso: inclui todos os tempos envolvidos na tarefa, exceto o tempo de trabalho após a liberação do recurso.
Observar que a carga de trabalho do agente e a carga de trabalho do recurso físico são diferentes.
A carga do recurso inclui o retardo (espera na fila) que não faz parte da carga do agente.
Em contrapartida, o agente executa trabalho de backoffice não considerado no cálculo da carga do recurso físico envolvido.
Isso leva à duas importantes considerações para dimensionat equipes e recursos:
Equipes e recursos devem ser calculados ao mesmo tempo …
Quanto maior a equipe para tratar uma carga de trabalho, menor será o retardo ao qual estarão sujeitos os consumidores ou usuários finais que acessam o serviço.
A quantidade de agentes na equipe impacta o retardo e a quantidade de recursos que serão necessários.
Não é possível estimar a quantidade de recursos sem calcular quantos agentes irão tratar a carga de trabalho projetada.
Não existe uma razão fixa entre equipes e recursos …
Estatisticamente, maiores grupos de recursos concentrados são mais eficientes que menores grupos.
Por outro lado, para cada operação os tempos envolvidos no TMA é diferente, assim como a tolerância à fila difere de operação para operação. Em decorrência, os objetivos de níveis de serviço podem ser diferentes.
Principais Tradeoffs do Dimensionamento de Recursos
1º princípio
Quando o nível de serviço NS tende a subir, a ocupação tende a cair ou ociosidade tende a aumentar (mantendo a mesma carga de trabalho)
Quando aplicamos fórmula de Erlang, todas essas variáveis aleatórias são “amarradas” num sistema de tradeoff.
Pergunte para você mesmo: é intuitivo ou fisicamente explicável que, quando mantemos a mesma carga de trabalho e aumentamos o NS, a ocupação de agentes deve diminuir?
Usando o exemplo de caixas de banco. Se houver caixas vazias, esperando um cliente, o atendimento é mais rápido (o NS tende a subir)?
R: Sim.
Essa relação entre ocupação e nível de serviço é muitas vezes mal entendida.
É comum a aplicação de uma lógica incorreta: “Se os agentes realmente trabalham com afinco, o nível de serviço aumenta e também a ocupação”.
Isso não é verdade!
Na realidade, se a ocupação do agente de serviço é alta, êle estÁ atendendo solicitações de serviço uma após outra, com pequeno ou nenhum tempo de espera entre serviços.
Isso significa, que as chamadas vão sendo acumuladas na fila e o nível de serviço tende a cair.
No pior cenário, de ocupação é 100%, todos os usuários finais que acessam o sistema gastam pelo menos algum tempo na fila.
Quando o nível de serviço fica melhor, o nível de ocupação cai. Desta forma, a média de serviços por agente também cai.
Daí concluímos que estabelecer padrões de SLAs por quantidade de serviços tratados é injusto e inadequado, já que o agente não pode, por si só, controlar a ocupação.
2º Princípio … para um crescimento constante de NS, chegará um ponto em que o aumento de recursos não gerará melhorias significativas e o retorno do investimento diminuirá.
O segundo princípio trata da “relação estatística” entre NS e Quantidade de Agentes.
3º Princípio … estatisticamente, menores quantidades de maiores grupos de recursos e pessoas é melhor do que muitos grupos com com menor concentração de recursos e pessoas.
4º Princípio … é melhor ter poucos grandes grupos de agentes multiespecializado do que muitos grupos de agentes pouco especializados. Essa lei é influenciada pela lei anterior.
5º Princípio … para uma dada carga de trabalho N, aumentar a equipe implica diminuir a velocidade média de atendimento.
6º princípios … para uma dada carga de trabalho, aumentar a equipe gera diminuir a carga de trabalho por pessoa.
Tradeoff é uma expressão em inglês que define uma situação em que há conflito de escolha entre uma, duas ou várias alternativas. Ocorre quando se abre mão de algum bem ou serviço para se obter outro bem ou serviço distinto. Tradeoff é balancear uma situação ou qualidade perante outra, a fim de produzir um resultado aceitável.
Princípios fundamentais governam o desempenho de sistemas e ajudam a entender os seus principais tradeoff.
Quando esses princípios são violados, reflexos negativos são gerados – níveis de serviços instáveis, dimensionamento de pessoal inadequado, custos excessivos, clientes insatisfeitos.
Apresentamos 6 princípios de dimensionamento.
O entendimento desses princípios auxiliarão em vários aspectos – na melhoria de processos de planejamento; na melhoria do processo de análise; definição de padrões adequados; na preparação de orçamentos precisos; na comunicação das atividades para níveis gerenciais superiores.
Dimensionar para o pico de tráfego.
- Utilizado para identificar os limites máximos de recursos que poderão ser exigidos.
- Não utilizado para dimensionar os recursos, já que isso implica que, na grande maioria do tempo, haveria ociosidade dos recursos alocados.
- Nesse sentido, existem medidas tais como HMM (Hora de Maior Movimento), PMM (Período de Maior Movimento), DMM (Dia de Maior Movimento) e outros, para testar esses limites.
Dimensionar pela média de tráfego
Calcular a quantidade média de tráfego e a de recursos, como sendo o dimensionamento básico.
Dimensionamento de acordo com as variações de tráfego.
No entorno de um valor médio (dimensionamento híbrido), com o objetivo de ajustar o dimensionamento para um alto índice de precisão, ou mínimo de desvio.
Os métodos de dimensionamento de acordo com variações de carga de trabalho precisam ser ajustados com a inclusão de atividades que as pessoas realizam offline, necessárias para compor o atendimento, que reduzem o tempo de serviços aos usuários, tais como: reuniões, pausa para lanches, pesquisa, resolução de problema, procedimentos para encaminhar processos internos para dar continuidade ao atendimento, treinamentos e outros.
Estratégias para períodos de Sobrecarga
De uma forma geral, de sobrecarga , nos preparamos para os próximos períodos de sobrecarga ou pico.
Retardar atividades.
Que podem ser de atividades de rotina e transferíveis, como treinamentos ou reuniões.
Esta é uma alternativa aceitável e bastante empregada.
Cuidados devem ser tomados para que não seja gerada uma cadeia de postergações.
Postergação é um grande gerador de impacto, instabilidade e a qualidade do atendimento, criando uma série de vários problemas de gestão.
Posicionar atividades de trabalho rotineiras para períodos de menor tráfego.
Esta é uma alternativa bastante empregada, mas exige cautela pelos riscos de informações e registros incompletos ou com falhas.
Retardar pausas e folgas.
Esta é uma alternativa habitual, com restrições apenas ao cumprimento das normas legais.
Utilizar banco de horas.
Pode ser ser utilizado de várias formas, a mais frequente é aumentar o tempo da escala de trabalho das pessoas.
Supervisores e gerentes ajudarem no atendimento.
É uma estratégia empregada em situações de curta duração, quando um pequeno ajuste da equipe pode estabilizar o nível de serviço.
Quando aplicada de forma comedida, pode gerar efeito positivo na diminuição da fila e no moral da equipe.
Uma desvantagem dessa alternativa é diminuir a disponibilidade do supervisor ou especialista para resolução de problemas mais críticos no atendimento.
Adicionalmente, caso torne-se frequente, esse tipo de atuação “mascara” a necessidade de equipe adicional.
Simplificar a tarefa ou serviço
Eliminar ou ajustar o scrip ou etapas do serviço.
Deve ser avaliado o impacto dessas alterações no resultado R do serviço.
Por exemplo, nos casos de televendas – up-selling e cross selling – o resultado R de vendas podem ser negativamente impactados e essa alternativa não será aconselhável.
Estratégias para Períodos de Sobrecarga
Nos casos em que a disponibilidade da equipe estiver abaixo do planejado, a operação estará “SOBRECARGA”.
Redirecionar pessoal de atendimento para diferentes filas e grupos.
Transferir serviços entre grupos mais “ocupados” para grupos menos “ocupados”, que tenham competência para o atendimento.
Retardar o atendimento da chamada: em vez de atender no primeiro toque, atender no 4º toque, por exemplo. Essa estratégia diminui a percepção de espera pelo atendimento, quando na realidade este tempo é igual nas duas situações. Ela também contribui para diminuição de custos de telefonia para serviços 0800, onde o contact center paga a chamada. Neste caso, a fila de atendimento das chamadas estará sendo “empurrada” para a operadora de telecomunicações que pode repercutir em sobrecarga nos entroncamentos; §Diminuir a quantidade de troncos telefônicos: isso gera maior quantidade de sinal de ocupado e rechamadas. A premissa é que os usuários irão rechamar e, que essa perda de “qualidade temporária”, compensa ou é a melhor solução; §Ativar mensagens de “callback”: essa alternativa pode ser feita de algumas formas. Por exemplo, o usuário deixa uma mensagem e o contact center faz o contato posteriormente.