martes, 27 de noviembre de 2012

TROUBLESHOOTING en NetApp



…. En tecnología uno de los puntos importantes en toda solución, diseño o producto es el denominado concepto de “Troubleshooting”, que no es más que mecanismos, procedimientos y herramientas que nos ayudarán a detectar un problema y posteriormente garantizar una resolución al problema de una manera eficaz y sobretodo en el menor tiempo posible.

    En este sentido NetApp ofrece una serie de procedimientos y herramientas que nos ayudarán en esta tarea como administradores. En este artículo abordaremos este tema.


Errores de “Panic” en DataOntap

Si se tienen problemas serios de hardware y software en una cabina de almacenamiento es probable que el sistema entre en un estado de “Panic”.

 Recomendaciones cuando el sistema entra en estado de “Panic”

1.- El “core” del sistema se almacena en el fichero /etc/crash

2.- Revisar desde consola el contenido del fichero /etc/messages para verificar si existiese

  algún mensaje relativo al “panic”.

3.- Reiniciar las controladoras.

Los mensajes de “panic” contienen información importante que ayudará al soporte técnico en la resolución del problema.

 
Resolución de problemas con Autosupport

Si el Autosupport está habilitado, se enviará automáticamente una alerta a soporte técnico

referente al problema.

Por lo tanto, se recomienda seguir los siguientes pasos.

 1.- Editar los mensajes de consola en el fichero /etc/messages

 2.- Desde el http://now.netapp.com , ejecutar la herramienta Panic Message Analyzer Tool.

 

3.- Copia el mensaje de “Panic” e introducir la versión del Data Ontap para determinar la posible causa del error.

4.- Si el motivo del “Panic”, es un problema conocido por NetApp es probable que con una versión o actualización superior se solucione el problema, si este no fuera el caso se tendría que abrir un caso a NetApp con todos estos datos.

Configuración de mensajes de LOGs

Como hemos comentado los mensajes generales de Logs se almacenan en /etc/messages dentro del vol0.

El nivel de logs del sistema es configurable dentro del fichero /etc/syslog.conf.

Se puede acceder al fichero /etc/messages exportando el volumen vol0 tanto por NFS como por CIFS.

Este fichero se actualiza cada Domingo a la medianoche y el fichero anterior es copiado al /etc/messages.0 y este al /etc/messages.1 , el sistema por defecto guarda los logs 6 semanas

El demonio dentro del DataOntap que ejecuta los logs es el “syslogd”.

Fichero /etc/syslog.conf

Este fichero puede ser configurable dependiendo del nivel de información , por defecto en las controladoras este fichero contiene la siguiente información.

filer*> rdfile /etc/syslog.conf

*.debug /etc/messages

Este fichero de lineas separadas por tabulador donde se configura los parámetros “facility” , el “level” y la “action” , los valores que se pueden configurar en estos parámetros son los siguientes.

 La sintaxis en el fichero sería.

 facility.level <tab> action
Los valores de la sintaxis se detallan a continuación

Facility


Level




Action

 

Ejemplo de /etc/syslog.conf

 

Syslog Translator Tool
Cuando nos encontramos con un mensaje de error o warning en las controladoras , NetApp posee la herramienta Syslog Translator, la cual podemos acceder a través del NOW.

Accedemos por CLI o por las interfaces de gestión de las controladoras y copiamos el mensaje que nos aparece referente al error.

 

 En el apartado de “Search String” copiamos el error que nos aparece y ejecutamos “Translate” , si es un problema reconocido por NetApp, nos aparecerá las acciones a seguir para solucionar este problema o nos sugerirá aplicar un “workaround”, o si se trata de algún “bug” reconocido o solucionado en una versión posterior. Si se requiere más información rellenar los campos “Release” y “Software”.

 

Bugs Tool

NetApp utiliza esta herramienta donde se encuentran documentados los diferentes Bugs que se han ido presentando en las diferentes versiones de DataOntap. Para ver esta herramienta dirigirse al sitio de Soporte de NetApp (http://now.netapp.com) en el apartado

Service and support / Bugs Online and Release Tools

 

 

 

My Autosupport Tool

 
Esta herramienta está basada en los autosupport que se envía de las controladoras de los clientes, esta información es procesada por NetApp y nos ofrece un portal donde podemos ver toda la configuración de nuestro almacenamiento como la distribución de los agregados, volúmenes, qtrees o Luns, así como el “upgrade Advisor” que es una herramienta donde a partir de la información de las controladoras NetApp nos recomienda las acciones a seguir en caso de actualizar una versión de DataOntap, en lo que se refiere a Troubleshooting nos muestra en caso de que el entorno requiera alguna actualización a nivel de discos, controladoras o algún “bug” reconocido por NetApp.

 

 
Bueno amigos, espero que este artículo les haya sido de utilidad .
Hasta pronto…
 
 

No hay comentarios:

Publicar un comentario