[RHEL] MegaRaid 모니터링 및 관리툴 사용하기

DELL 서버등에서 사용되는 레이드 컨트롤러로 LSI에서 OEM 제작 하는 MegaRaid가 있습니다.

PERC/X등으로 불리는 모델들인데 리눅스 기반에서 하드웨어 오류를 모니터링 하기에 문제가 있습니다. (있는줄 알았다-_-;)

리눅스의 기본 제공되는 HDD 모니터링 툴인 SMART로도 다음과 같은 에러만 내뱉는군요.

[code][root@Theeye ~]# smartctl -a /dev/sda
smartctl version 5.36 [i686-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/


Device: MegaRAID LD 0 RAID1   34G Version: 351X
>> Terminate command early due to bad response to IEC mode page
A mandatory SMART command failed: exiting. To continue, add one or more ‘-T permissive’ options.[/code]

현재 SmartMonTools는 3.38버젼까지 나와있는데 현재까지는 MegaRaid를 지원하지 않습니다.

하지만 [이곳]을 참고해 보면 CVS 상의 최신 소스는 MegaRaid를 지원하는 것을 알 수 있습니다.

하지만 그전에 혹시 MegaRaid측에서 제공하는 모니터링 툴이 있을까 찾아보니 아주 친절하게 있는 것을 알게 되었습니다.

[이곳]에 가보면 각각의 모델별로 모니터링 툴뿐만 아니라 각종 관리툴 및 펌웨어 업그레이드 유틸리티까지 제공합니다.

버젼업그레이드가 충실하지 않은것 같으니 SCSI사용자라면 그냥 다음을 사용하셔도 될것 같네요.

1053430053.gz


위의 파일을 압축 풀어 DellMgrMegamon을 설치합니다. snmp를 사용하기 위해서는 percsnmp를 설치하면 됩니다.

먼저 모니터링 툴을 가동시켜 보겠습니다.

[code][root@Theeye ~]# MegaCtrl -start
32 Bit Compiled Code

MegaCtrl Version (MIMD Linux Driver Compliant): DELL Version : 3.8 Aug 05, 2003

Set CheckConsistencyProgressInterval to 0
MegaCtrl:Service started normally[/code]
정상적으로 실행되는 것을 볼 수 있습니다. 이번엔 메일 알림 기능을 꺼버리겠습니다.
[code][root@Theeye ~]# MegaCtrl -disMail

32 Bit Compiled Code

MegaCtrl Version (MIMD Linux Driver Compliant): DELL Version : 3.8 Aug 05, 2003
The Mailing Option Disabled[/code]
MegaCtrl -help 명령을 사용하여 각종 옵션을 확인할 수 있습니다.

이후부터 /var/log/megaserv.log 파일에 로그가 쌓이게 됩니다. 로그를 살펴보니 이런 로그를 확인할 수 있었습니다.

[code][01/29/2009 (17:28:16)]:
    Adapter 0:  Battery Temperature GOOD.
[01/29/2009 (17:28:16)]:
    Adapter 0:  Battery Voltage GOOD.
[01/29/2009 (17:28:16)]:
    Adapter 0:  No of Charge Cycles = 0
[01/29/2009 (17:28:24)]:
    Adapter 1:  Battery Temperature GOOD.
[01/29/2009 (17:28:24)]:
    Adapter 1:  Battery Voltage GOOD.
[01/29/2009 (17:28:24)]:
    Adapter 1:  No of Charge Cycles = 3
[01/29/2009 (17:28:24)]:
    Adapter 1 Channel 0 Target 0:  Media Error Count=32, Other Error Count=0
[01/29/2009 (17:28:24)]:
    Adapter 1 Channel 0 Target 1:  Media Error Count=32, Other Error Count=0
[01/29/2009 (17:28:24)]:
    Adapter 1 Channel 0 Target 2:  Media Error Count=9, Other Error Count=0
[01/29/2009 (17:28:24)]:
    Adapter 1 Channel 1 Target 12:  Media Error Count=32, Other Error Count=0
[01/29/2009 (17:28:24)]:
    Adapter 1 Channel 1 Target 13:  Media Error Count=12, Other Error Count=0
[01/29/2009 (17:28:28)]:
    -: DELL SES Information:-
    Adapter 1 Channel 0 Target 6 [ Fans=4, Power Supplies=2 & Temperature Sensors=4 ]

[01/29/2009 (17:28:28)]:
    -: DELL SES Information:-
    Adapter 1 Channel 1 Target 6 [ Fans=4, Power Supplies=2 & Temperature Sensors=4 ]

[01/29/2009 (17:28:29)]:
    Adapter 1,Channel 1,Target 12: is going to FAIL.[/code]

보면 알 수 있듯이 채널0의 0,1,2번 하드디스크에 에러가 발생하였고 채널1의 12, 13번 하드에 에러가 발생했던것을 알 수 있습니다.

그리고 마지막에 채널1의 12번 하드가 돌아기시기 직전이라고 알려주는군요.

이번에는 DellMgr프로그램을 사용해 보겠습니다.
[code][root@Theeye ~]# dellmgr[/code]
사용자 삽입 이미지

12번 하드의 정보를 Object – Physical 메뉴에서 확인해 보았습니다. 곧 고장날것이라고 알려주는군요.

사용자 삽입 이미지
다른 하드의 정보를 보니 멀쩡하군요. 이런식으로 레이드로 묶여있더라도 각각의 디스크 정보를 확인할 수 있습니다.

사용자 삽입 이미지
기존의 남아있는 디스크를 핫스페어 디스크로 설정하였습니다. 콘솔상에서 모든 레이드 작업을 할 수 있습니다.

실제로 리빌드 상태를 확인할 수 있고, 리빌드를 정지시키거나 각종 룰을 변경할수도 있습니다.

정말 좋군요!

2010년 5월 27일 추가 –
/usr/sbin/dellmgr 파일의 상단에 다음을 추가하면 위와 같이 화면이 깨지는 문제를 해결할 수 있습니다.
[code]TERM=xterm[/code]

Apache MINA 2.0 에코서버 만들어 보기

사용자 삽입 이미지

제작년인가 JCO 컨퍼런스에서 이희승님의 발표 이후에 잊을 수 없던 프로젝트가 있었습니다.

바로 MINA(A Multi-purpose Infrastructure for Network Applications)인데요.

간단하게 말하면 자바의 네트워크 애플리케이션을 위한 프레임워크입니다.

필터를 사용한 뛰어난 확장성과 프로토콜 코덱과 비즈니스 로직을 분리하여 유지보수와 재사용성을 높인것이 특징입니다.

더군다나 커미터가 이희승님이라는 것이 중요한 점입니다. 한글로 질문해도 답변해 주시겠죠? -_-a

간단하게 예제 프로그램을 따라 만들어 보았습니다. [이곳]을 참고하였습니다.

현재 MINA2가 M3까지 나왔더군요. 예제를 위해서는 MINA코어뿐만 아니라 SLF4JLog4J가 필요합니다.

SLF4J의 경우에는 slf4j-api.jar파일과 slf4j-logj12.jar가 필요합니다. 13버젼용도 있지만 아직 알파버젼이니 12로 하기로 하였습니다.

그리고 log4j 1.2버젼의 jar로 세팅합니다.

MinaTimeServer
[code]import java.io.IOException;
import java.net.InetSocketAddress;
import java.nio.charset.Charset;
 
import org.apache.mina.core.service.IoAcceptor;
import org.apache.mina.core.session.IdleStatus;
import org.apache.mina.filter.codec.ProtocolCodecFilter;
import org.apache.mina.filter.codec.textline.TextLineCodecFactory;
import org.apache.mina.filter.logging.LoggingFilter;
import org.apache.mina.transport.socket.nio.NioSocketAcceptor;
 
public class MinaTimeServer
{
    private static final int PORT = 9123;
 
    public static void main(String[] args) throws IOException
    {
        IoAcceptor acceptor = new NioSocketAcceptor();

        acceptor.getFilterChain().addLast( “logger”, new LoggingFilter() );
        acceptor.getFilterChain().addLast(“codec”, new ProtocolCodecFilter(
                                            new TextLineCodecFactory(Charset.forName(“UTF-8”))));
 
        acceptor.setHandler(new TimeServerHandler());
 
        acceptor.getSessionConfig().setReadBufferSize(2048);
        acceptor.getSessionConfig().setIdleTime(IdleStatus.BOTH_IDLE, 10);
 
        acceptor.bind(new InetSocketAddress(PORT));
    }
}[/code]
Non-Blocking IO로 만듭니다. FilterChain이라는것에 필터를 추가합니다.

addLast라는 것을 보니 내가 원하는 순서대로 필터를 등록할 수 있는 모양입니다.

위와 같이 로깅을 하거나 인코딩 코덱을 만들어 사용할 수 있습니다.

핸들러를 추가하고 버퍼와 유휴시간을 정의한 후에 PORT를 설정하여 Bind합니다.

TimeServerHandler
[code]import java.util.Date;
 
import org.apache.mina.core.service.IoHandlerAdapter;
import org.apache.mina.core.session.IdleStatus;
import org.apache.mina.core.session.IoSession;
 
public class TimeServerHandler extends IoHandlerAdapter
{

    @Override
    public void exceptionCaught(IoSession session, Throwable cause)
        throws Exception
    {
        cause.printStackTrace();
    }

    @Override
    public void messageReceived(IoSession session, Object message)
        throws Exception
    {
        String str = message.toString();
 
        if(str.trim().equalsIgnoreCase(“quit”))
        {
            session.close(true);
            return;
        }
 
        Date date = new Date();
        session.write(date.toString() + “\r\n”);
        System.out.println(“Message written…”);
    }

    @Override
    public void sessionIdle(IoSession session, IdleStatus status)
        throws Exception
    {
        System.out.println(“IDLE ” + session.getIdleCount(status));
    }
}[/code]
이녀석이 실제로 통신에 사용되는 핸들러입니다. 메시지를 받을때 마다 messageReceived이 호출됩니다.

쓰레드 방식의 모델이라 보기 힘든 구조네요, 콜백형식으로 작동하는 것을 알 수 있습니다.

다음에는 객체를 Serial로 주고 받을 수 있는지 해봐야겠습니다.

sessionIdle은 Main에서 정의한 유휴시간마다 호출되는 녀석입니다. 10초로 설정해 두었으니 10초동안 유휴상태로 있다면 그때마다 이 메서드가 호출됩니다.

getIdleCount를 이용해 카운트도 알 수 있군요. 서버를 완성했으니 실행해 볼까요.

사용자 삽입 이미지


quit를 입력하면 종료되고 그 이외의 문자를 입력하면 시간이 출력되는 것을 알 수 있습니다.