Professional Documents
Culture Documents
Apresentação Frisia - V1
Apresentação Frisia - V1
Marcelo Dante
Especialista DBA
Objetivo:
O objetivo deste documento é evidenciar erros e falhar apresentados no relatório EXAchk enviado
pela equipe de banco de dados da Frisia para análise.
O resultado desta análise serve de base para possíveis ações de ajustes e adequações as melhores
práticas visando manter a integridade do ambiente Exadata, assim como os seus respectivos banco
de dados.
Todas as informações coletadas pelo EXAchk são sintetizadas em um único relatório sendo efetuado
comparativos com também o relatório sundiag, também encaminhado pela equipe Frisia.
A informação passada foi de possíveis problemas de performance e timed out do ambiente como mostra do documento de referência
abaixo, porém para uma avaliação correta, seria necessário o acesso ao ambiente e efetuar uma nova execução do EXAchk.
https://docs.oracle.com/en/engineered-systems/health-diagnostics/autonomous-health-framework/ahfug/index.html
Entendendo o EXAchk
O EXAchk possui relatórios gerados e categorizados de acordo com o grau de importância, e são divididos nas seguintes
categorias:
CRITICAL – Alertas com criticidade alta referente ao funcionamento do Exadata, Serviços e Banco de Dados;
FAIL – Alertas de falhas reportadas no ambiente, podem ser considerado falhas de implementação e até mesmo falhas ocorridas
no decorrer da utilização do ambiente, refere-se também ao funcionamento do Exadata, Serviços e Banco de Dados;
WARNING – São alertas de menor importância, porém que requer atenção também se refere ao funcionamento do Exadata,
Serviços e Banco de Dados;
PASS – São todos os serviços que não apresentaram problemas na coleta do EXAchk, também se refere ao funcionamento do
Exadata, Serviços e Banco de Dados;
Nesta apresentação iremos focar nos alertas CRITICAL’s e FAIL’s, estaremos reportando alguns deles, pois para outros seria
necessário efetuar mais coletas de informações do ambiente e entender o seu funcionamento, porém todos serão listados nesta
apresentação.
Alertas Critical
Abaixo estaremos reportando os alertas com o status CRITICAL identificados no EXAchk, foram avaliados alguns em particular
que serão apresentados e que devem ser tratados com maior urgência, isso não abstem dizer que os demais não possuam a
mesma importância, porém são cenários que dependeriam de acesso e entendimento do ambiente para uma melhor análise.
Alertas Critical
Neste primeiro cenário elencamos o primeiro report System is exposed to Exadata Critical Issue DB42 , pois trata-se de um alerta
referente a um cenário de disaster e recovery, como mostra a descrição do alerta abaixo:
Este alerta visa evitar que haja problemas de corrupção dos backup’s, evitando assim possíveis perdas em um cenário de
disaster/recovery.
Este alerta evidencia possíveis problemas de comunicação entre os servidores do cluster, a utilização do interconnect é altamente
recomendada afim de garantir maior estabilidade entre os servidores que formam o cluster, além de aumentar a performance e
disponibilidade do ambiente.
Alertas Critical
Conforme reportando no slide anterior abaixo a lista de instâncias a serem regularizadas:
Alertas Critical
Continuando o slide anterior abaixo a lista de instâncias a serem regularizadas:
O TFA possui uma coleta automática, que fica ativa por padrão, e monitora seus logs e pesquisar por problemas.
Quando um evento for detectado, o TFA coletará e guardará em seu repositório todos os logs necessários para análise do problema. Os logs poderão
ser posteriormente acessados pelo DBA para análise e, caso necessário, poderão ser utilizados para a abertura de chamado no suporte.
Hoje no ambiente atual há muitos pontos a serem corrigidos conforme evidenciados, o volume de alertas gerados pelo Exachk
pincipalmente os categorizados como CRITICAL e FAIL devem ter uma atenção maior afim de garantir o bom funcionamento do
ambiente.
Muitos pontos não foram debatidos nesta apresentação, pois dependem de um maior campo da analise, e de um mapeamento
maior de todo o funcionamento do ambiente.
A recomendação é de que todos esses alertas sejam tratados antes mesmo da entrada em produção do ambiente, pois muitos
pontos dependem de janela de outage e indisponibilidade.
Dúvidas ?
!!!
ado
r ig
Ob
Análise ambiente Exadata - FRISIA
Marcelo Dante
Especialista DBA
www.compwire.com.br
contato@compwire.com.br
+55 41 3333.6066
Catálogo de Serviço Compwire
Administração Bodyshop Garantia Gerência de
Consultoria Instalação
de Ambiente (residente) Equipamento Projeto
Melhoria contínua Storage Storage SLA (acordo nível serviço) Gestão de Projeto Desembalagem
Customização e ajuste Servidor Servidor Substituição de peça Comunicação Montagem
Avaliação e diagnóstico Backup Backup Acionamento Call-Home Controle de prazos Instalação Física
Preventiva e corretiva Virtualização e S.O. Virtualização e S.O. Preventiva Entregáveis Configuração lógica
Vistoria Rede Rede Atendimento 24x7 Documentação Atualização de firmware
Execução de projeto Segurança da Informação Segurança da Informação Atendimento 8x5 Relatório Migração de dados
Documentação Gerência de projeto Gestão operacional Reunião periódica
Sobre aviso Gestão operacional
Manutenção
Monitoramento 24x7
Instalação e configuração de appliance e SGBD
Atendimento 24x7
Atualização e migração de SGBD
Firewall
Migração
Rede e Conexão
Sustentação ambiente
Virtualização
Consultoria
Infraestrutura
Tuning
Processos de negócio
Monitoramento
Automação