Solaris/문제해결

var/fm/fmd/errlog 및 fltlog 초기화

[건희아빠] 2011. 4. 22. 18:02

원본 : http://www.solarisschool.com/qna_new/view.html?board=qna2&no=24601&start=&sselect=&mode=&qry_string=



안녕하세요.
얼마전부터 서버를 담당하게 되었는데,
서버는 SunOS 5.10 ( Solaris 10 ) 입니다.
디스크 용량을 확인하던중 /var/fm/fmd/errlog 및 fltlog 파일이
엄청난 용량으로 자리잡고 있고, errlog 파일은 현재 실시간으로 계속 증가하고 있습니다. ㅠ,.ㅠ



인터넷에서 찾아보다가
fltlog 파일에 대해서는 다음과 같은 글을 보게되었는데요.
-------------------------------------------------------------------
#rm /var/fm/fmd/fltlog
#touch /var/fm/fmd/fltlog
#fmadm rotate fltlog
fmadm:fltlog has been rotated out and can now be archived

#fmddump
TIME UUID SUNW-MSG-ID
fmdump: /var/fm/fmd/fltlog is empty
-------------------------------------------------------------------


이글따라 하면 fltlog 파일은 초기화 될것 같기는 한데,
fmdup의 기능도 모르는데 무작정 한다는게 좀 부담이 갑니다.

/var/fm/fmd/ls -l 했을때의 디렉토리 구조입니다.

------------------------------------------------------------------------
ÃÑ 28960708
drwx------ 3 root sys 512 2007³â 10¿ù 16ÀÏ ckpt
-rw-r--r-- 1 root root 14795732356 12¿ù 17ÀÏ 17:42 errlog
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:11 errlog.1
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:06 errlog.10
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:11 errlog.2
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:11 errlog.3
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:10 errlog.4
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:10 errlog.5
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:10 errlog.6
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:09 errlog.7
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:07 errlog.8
-rw-r--r-- 1 root root 0 7¿ù 15ÀÏ 16:07 errlog.9
-rw-r--r-- 1 root root 24094513 2007³â 12¿ù 28ÀÏ fltlog
drwx------ 2 root sys 778240 2008³â 1¿ù 2ÀÏ rsrc
drwx------ 2 root sys 512 2007³â 6¿ù 16ÀÏ xprt
------------------------------------------------------------------------

그리고 현재 계속 증가하고 있는 errlog 파일의 내용입니다.
------------------------------------------------------------------------
Òí‘`˜ð
è@@IHÕ
@@#„g?@´@8class ereport.cpu.ultraSPARC-IIIi.frc en*@ÍðÜdetector version$ scheme cpu cpuid cpumask4,(serial
15EF5D510C5 afsâ$(
afar-status afa$8` pÜ tl ttc$(
privileged multiple((syndrome-status syndromeâ((
l2-cache-ways$( U00error-dispositio((
dcache-ways$(
icache-ways __ttl0(__todIHÕ
#„gÀøð
ˆ@@IHÕ
@@feÃ?@T@8class ereport.cpu.ultraSPARC-IIIi.ce enNnî Üdetector version$ scheme cpu cpuid cpumask4,(serial
15EF5D510C5 afsâ$(
afar-status afa$8 p tl ttc$(
privileged multiple((syndrome-status syndromeâ((
l2-cache-ways$( I00error-dispositio‰((
dcache-ways$(
icache-ways resource version$ scheme mem00unum MB/P1/B0/D1: B0/D1 __ttl0(__todIHÕ
------------------------------------------------------------------------



1. 위와 같은 상황에서 errlog 및 fltlog 파일을 초기화 하고 싶은데 , 어떤 절차를 거쳐야 합니까?
2. fmdump 어떤 명령어입니까?
3. errlog 및 fltlog 파일은 어떤정보를 가지고 있으며, 용도는 무엇입니까?
4. errlog 로그파일 내용 해석 좀 부탁드립니다. 계속 증가하고 있다는 것은 뭔가 문제가 있다는것인데 해결방법도 좀 알수 있을까요?




솔라리스 폴트 매니저의 데몬입니다. (fmd: fault manager daemon) [man fmd]하시면 더 자세히 알 수 있습니다.

쉽게 설명하면 하드웨어/소프트웨어에 문제 있는것 같네요. 버그가 아니라면, A/S업체 불러서 해결하셔야 할것 같네요. 패치가 필요할지도 모릅니다. 이정도라면 [cat /var/adm/messages] 해보시면 메시지 나올듯 하네요.

로그가 너무 많아 디스크에 문제가 생기면, 서비스 받기 전까지 ~잠시~ 꺼두는 것도 좋을듯 하네요. [svcadm disable svc:/system/fmd:default]





oot@web # fmdump -v
TIME UUID SUNW-MSG-ID
Oct 17 18:00:34.5908 c9b912eb-7c3a-edeb-d63d-b905f4c6d999 SUN4U-8000-2S
95% fault.memory.dimm

Problem in: mem:///unum=MB/P1/B0/D1:B0/D1
Affects: mem:///unum=MB/P1/B0/D1:B0/D1
FRU: mem:///unum=MB/P1/B0/D1:B0/D1


이런 결과가 나와서 인터넷 찾아보다가
root@web # fmadm faulty
STATE RESOURCE / UUID
-------- ----------------------------------------------------------------- faulted fmd:///module/cpumem-diagnosis
9f1e2eea-a9b1-6392-a656-9919aa4dd816
-------- -----------------------------------------------------------------root@web #
root@web #
root@web #
root@web # fmadm repair fmd:///module/cpumem-diagnosis
fmadm: recorded repair to fmd:///module/cpumem-diagnosis

이렇게 실행 해서 확인해보니
root@web # fmadm faulty
STATE RESOURCE / UUID
-------- -----------------------------------------------------------------

이렇게 아무것도 안나옵니다. 하지만

root@web # fmdump -v
TIME UUID SUNW-MSG-ID
Oct 17 18:00:34.5908 c9b912eb-7c3a-edeb-d63d-b905f4c6d999 SUN4U-8000-2S
95% fault.memory.dimm

Problem in: mem:///unum=MB/P1/B0/D1:B0/D1
Affects: mem:///unum=MB/P1/B0/D1:B0/D1
FRU: mem:///unum=MB/P1/B0/D1:B0/D1
또 이렇게 나와요....



일단, 메모리쪽 문제인것 같아보입니다. 그리고 조만간 업체를 불러야 될것 같습니다.

님께서 말씀 하시데로 서비스 중지 하는게 좋을것 같습니다.

그런데, errlog파일 초기화 하는 방법이 어떻게 되는지요...
혹시나 해서 errlog 파일 백업은 했구요...
디스크 풀차서 .... 지워야하는데요... 방법이 없나요?

/etc/logadm.conf 에 보면
/var/fm/fmd/errlog -M '/usr/sbin/fmadm -q rotate fltlog && mv /var/fm/fmd/errlog.0- $nfile' -N -P 'Thu Dec 18 07:52:47 2008' -s 2m

위처럼 되어 있습니다.

하지만 /var/fm/fmd 디렉토리에 errlog0 이 빠져 있고 로그파일이 errlog, errlog1, errlog2 .... 이렇게 되어 있습니다. 그래서 인지 errlog 파일만 사이즈가 무지하게 크고 나머지는 사이즈가 0입니다.... errlog0파일을 생성해 주면 로그가 순차적으로 분산되서 쌓일까요?

앗.. 그리구요
root@web # ps -ef | grep fmd
root 370 1 0 10¿ù 08 ? 60706:22 /usr/lib/fm/fmd/fmd
이 프로세스는 모하는건가요?
크론탭에 있는 /usr/sbin/logadm 를 실행할려고 했더니 errlog파일을 다른 놈이 잡고 있다고 나옵니다..

아........... 산너머산 입니다 ㅠ,.ㅠ

그럼 수고하십시요.




errlog.? 파일은 그냥 지우셔도 됩니다. errlog 파일은 지우고 fmd 다시 시작해주면 될거 같네요. 아니면 서버 리부팅 하던가요.

# cp /dev/null errlog
# svcadm disable svc:/system/fmd:default
# svcadm enable svc:/system/fmd:default




http://rinovation.tistory.com/15


http://blog.paran.com/jbleea/34628423