Skip to main content

Acompanhe nossas dicas para você entender quais são os principais pontos que merecem atenção na hora de se iniciar um projeto de monitoramento de infraestrutura de TI.

A área de tecnologia da informação é, hoje, fundamental para a sustentação de qualquer negócio. Com a transformação digital, acelerada em 2020 por causa da pandemia, muitas empresas dependem 100% de tecnologia para operar de maneira eficiente e competitiva. Portanto, realizar a monitoração de toda essa camada de infraestrutura de TI reduz drasticamente as indisponibilidades, as interrupções e as falhas que possam vir a causar prejuízos a sua empresa.

Neste artigo, separamos algumas dicas para te ajudar a entender quais são os principais pontos que merecem atenção para se iniciar um projeto de monitoramento de infraestrutura de TI. Acompanhe!

 

1 – Identificar o que precisa ser monitorado

Com uma ferramenta de monitoração conectada à rede corporativa é possível receber alertas quando ocorrer algum problema relacionado a indisponibilidade na infraestrutura ou lentidão no tempo de resposta dos principais sistemas utilizados. Isso traz maior agilidade na resposta aos incidentes.

Entretanto, nem tudo que está conectado à rede da sua empresa deve ser monitorado. Um erro comum de grande parte dos profissionais ao iniciar um projeto de monitoração do ambiente é querer monitorar 100% dos equipamentos e sistemas. Nossa recomendação é começar pelos sistemas mais críticos e, com o tempo, evoluir para o resto da infra.

Através da nossa experiência, percebemos que quando TUDO é monitorado, grande parte dos alertas não recebem a devida atenção por parte da equipe de infraestrutura, causando excesso de alertas e sobrecarregando a equipe com itens que não deveriam ser prioritários. Uma dica importante é monitorar os elementos de tecnologia que sejam cruciais para o funcionamento pleno do seu negócio.

 

2 – Definir um profissional dedicado à tarefa

Os profissionais da área de tecnologia são conhecidos por acumular funções, criando a imagem de que são “resolvedores de problemas”. Essa é uma imagem ainda muito comum, mas que demonstra pouca maturidade em Governança de TI por parte das empresas.

Quando falamos em monitoramento de TI, é importante que as empresas possuam um profissional dedicado a esta tarefa, seja ele interno ou contratado através de serviço. O monitoramento deve ser feito por alguém que entenda do assunto e saiba o que fazer para solucionar problemas caso algum alarme soar. Além disso, precisa ter uma visão abrangente para escalar os problemas mais complexos.

Uma vez que o ambiente de TI está sempre mudando, seja com novas aplicações ou arquiteturas em nuvem, é importante que estas mudanças reflitam na monitoração. Ou seja, novos itens devem ser adicionados à ferramenta para que os alarmes continuem confiáveis.

Portanto, um profissional dedicado é importante para dar conta do volume de trabalho e manter a monitoração atualizada. Caso você não possua equipe para atuar na monitoração é possível contratar empresas especializadas nesta atividade.

 

3 – Escolher a ferramenta de monitoramento

Aqui na InterOp, utilizamos o OpMon, Zabbix e Priax para a realização da monitoração dos ambientes complexos de nossos clientes. Independente da ferramenta escolhida, ela deve ser corretamente administrada pelos profissionais encarregados por essa atividade.

O domínio da equipe sobre a plataforma é um importante fator de escolha, além das necessidades específicas da empresa que podem gerar customizações que precisam ser suportadas pelas ferramentas.

 

4 – Criar alertas de monitoramento e regras de escalação

A escalação de incidentes ajuda a automatizar processos e direcionar os incidentes aos seus devidos responsáveis técnicos. Deste modo, caso esta funcionalidade seja corretamente configurada, quando ocorrer um problema relacionado a banco de dados, por exemplo, o DBA (administrador de banco de dados) será acionado para atuar no incidente.

Esses alertas podem ser configurados para notificar na plataforma de comunicação de sua preferência, como Slack, Microsoft Teams, Telegram, WhatsApp, SMS ou E-mail. Assim, no exato momento em que ocorrer uma indisponibilidade ela será alertada para o profissional capaz de lidar com o problema.

 

5 – Definir Indicadores de desempenho

Quando se utiliza indicadores de desempenho, ficam mais evidentes os pontos fracos e fortes da infraestrutura de TI. Desta forma, é possível ter um norte para a tomada de decisões e de possíveis oportunidades, reduzindo o nível de incerteza.

Existem diversos indicadores que podem ser aplicados ao monitoramento. Os mais utilizados são o SLA (Service Level Agreement), o MTTR (Tempo Médio para Reparo) e o MTBF (Tempo Médio Entre Falhas).

 

6 – Focar no negócio

Outro ponto que merece atenção é o foco da monitoração. Percebemos que na grande maioria das vezes a infraestrutura é colocada como prioridade, quando na verdade o foco deveria ser no negócio, pois a infraestrutura só existe para sustentar as atividades de uma organização.

Ou seja, uma monitoração bem feita deve contemplar a disponibilidade do negócio e como isso se reflete nos elementos de infraestrutura.

 

7 – Monitorar a causa raiz dos problemas

A ideia da monitoração da causa raiz dos problemas é tentar alinhar a TI ao negócio, ligando indisponibilidades de serviço ao elemento de infraestrutura monitorado. Afinal, quando uma empresa não consegue gerar NFes é importante que o problema seja logo identificado e devidamente corrigido.

Portanto, toda essa estrutura pode ser hierarquizada por plataformas poderosas, que agregam maior valor à monitoração, permitindo que a notificação de indisponibilidade de um ERP, por exemplo, possa identificar exatamente qual elemento da estrutura causou essa indisponibilidade. Além disso, ao monitorar o tempo de resposta, pode-se identificar qual componente está causando o gargalo na performance.

 

8 – Aplicar Gestão à Vista

A gestão à vista é a prática de compartilhar indicadores de performance e qualidade com a equipe para que os dados orientem a tomada de decisão. O fato da equipe participar na escolha dos indicadores e em como eles serão apresentados transmite senso de pertencimento e responsabilidade para todos os envolvidos.

Esse modelo de gestão pode ser facilmente aplicado à monitoração da infraestrutura com a criação de dashboards. Eles proporcionam uma visão clara da saúde do seu ambiente de TI, podendo ser customizados de acordo com as necessidades do negócio. Com dashboards é possível identificar problemas de maneira rápida, já trazendo quais deles devem ser resolvidos prioritariamente.

 

9 – Criar relatórios de desempenho

O acompanhamento de relatórios deve ser feito com frequência, pois com eles você consegue estabelecer um padrão de qualidade do seu monitoramento e aumentar a qualidade dos SLAs. Dentro da monitoração de TI, os relatórios mais utilizados são os de disponibilidade, capacidade e performance.

O relatório de disponibilidade traz informações referentes ao tempo em que um elemento ficou disponível e indisponível. O relatório de capacidade indica principalmente tendências de esgotamento de recursos. Por fim, o relatório de performance informa os tempos de resposta de cada passo de uma aplicação, por exemplo.

Vale destacar que os relatórios trazem uma visão sistêmica do ambiente de TI. Eles devem ser analisados e tratados de forma periódica, semanalmente ou mensalmente.

 

10 – Estruturar um NOC

O NOC pode ser considerado uma evolução da prática de monitoramento de TI. Também conhecido como Central de Operações de Rede, é um serviço interno ou externo que atua de forma preventiva e proativa, com objetivo de manter o ambiente de TI o mais estável possível.

Pode ser definido como uma equipe que atua, geralmente 24×7, para identificar, escalar e/ou resolver incidentes. No NOC são realizados o monitoramento e a gestão de eventos de TI.

Pelo NOC são monitorados todos os ativos de TI de uma empresa, como hardwares, sistemas, aplicativos, dispositivos de rede, links de internet e todos os indicadores de tecnologia da informação. Também é possível criar alarmes personalizados especificamente para cada ativo e agir de maneira antecipada diante de problemas que viriam a interferir na continuidade do negócio.

Fonte: https://www.interop.com.br/blog/monitoramento-de-ti/