한국레드햇 너나우리 DNSEver qmail.kldp.org 어드민플레이

안녕하세요, 영자 디지문입니다.

 

여러분들께 좀 안 좋은 소식을 들려드리게 되어 죄송하고 또 죄송할 따름입니다.

 

어제 16일 14시 이후부터 서버가 또 말썽을 일으키더군요. 서비스 접속 안 되고 네트워크 핑만 되는 상태가 다시 발생하였습니다.

 

그런데 이번엔 종전보다 증상이 약간 달랐습니다. 아파치 웹서버는 살아 있는데 DB를 긁어 출력해야 하는 웹페이지가 출력이 안 되는 현상이 나타나더군요. 서버 상태를 보려 해도 SSH나 FTP 모두 접속이 되지 않는 것이었습니다.

 

17일 00시 50분 간신히 서버를 다시 올릴 수 있었습니다. 피시방 사장님께서 외출 나갔다 복귀하시자마자 밤새 수고해 주셔서 겨우 올릴 수 있었습니다.

 

그러나...

 

 

 

 

서버에서 레이드 컨트롤러가 인식되지 않는 것이었습니다.

 

다른 메인보드에 장착해 보아도 인식되지 않았습니다.

 

그렇습니다. 컨트롤러 자체가 나간 것이었습니다. 컨트롤러의 롬바이오스 칩이 나간 것으로 추정됩니다.

 

하드디스크 물리적 장애에 대비하고자 레이드 컨트롤러를 도입한 것인데 사실 레이드 컨트롤러 자체가 나가면 답이 없긴 합니다. 하지만 여타 부품에 비해 고장나는 빈도가 낮은 축에 속하는 부품인지라 신뢰하며 사용해 왔던 게 사실입니다.

 

레이드 컨트롤러에 연결된 하드디스크의 컨디션은 제대로 체크하더라도 정작 컨트롤러 자신의 컨디션은 제대로 체크 못하나 봅니다. 한 방에 그냥 훅 가네요. ㅡ,.ㅡ;;

 

레이드 컨트롤러에 연결된 레이드 어레이 쪽에 /home, MySQL 디비를 모두 위치시켜 놓고 운영하고 있었습니다. 하드디스크에 장애가 나더라도 서비스 중단 시간을 최대한 절감하자는 목적으로 레이트 어레이에 갱신 빈도가 가장 잦은 /home과 MySQL 디비를 위치시켜 놓은 것이죠.

 

그리고 물리적으로 다른 하드디스크에 하루 한 번씩 주기 백업도 해주면서 만약의 사태에 이중으로 대비하고 있었습니다.

 

레이드 컨트롤러는 그렇다 치고 더욱 문제가 되는 것이 하필 이번 하드웨어 장애가 빈번하게 일어나는 와중에 백업용 하드디스크가 자꾸 인식이 되었다 말았다 하는 증상이 나타나는 것입니다.

 

하드웨어 문제가 하도 골치라서 안 그래도 서버에 연결된 하드디스크 수를 최소화시키고 메인보드도 교체할 계획이었습니다.

 

지난 일주일 동안 잠시 백업본도 레이드 어레이 쪽에 저장되도록 운영하고 있었는데 손을 써보기도 전에 하필 장애가 발생해 버렸습니다. ㅜ,.ㅜ;;

 

최신 백업본마저 소멸되었다는 얘기입니다.

 

 

 

다행이 일주일 전에 12월 12일에 원격으로 백업을 받아놓은 데이터가 있어서 지금 그것으로 복구하고 있는 중입니다.

 

백업본 하나만큼은 자신 있다고 큰소리 쳐왔건만 이렇게 최악의 경우의 수를 만나 버리고 말았습니다.

 

레이드 컨트롤러 자체가 나가질 않나~ 하필 그 동안 백업용 하드디스크마저 문제가 있었질 않나...

 

지금 사무실에서 업무를 보는 틈틈히 복원 작업하고 있습니다. 아직 제대로 출력되지 않는 홈피들이 다수 있습니다. 완전히 다 끝나면 다시 재공지토록 하겠습니다.

 

 

 

 

--------------------------------------------------------------------------------------

 

 

17일 11시 30분에 1차 복원 작업 완료하였습니다. 제가 원격백업해 두었던 자료가 아마 12월 12일이나 13일 자료일 겁니다.

 

홈페이지에 이상한 에러 문구가 떠 있다거나 게시판 로그인이 안 되는 증상이 있는 등의 문제가 있는 분들께선 서슴없이 문의 주시기 바랍니다.

 

정말 죄송합니다. 백업의 중요성은 아무리 강조해도 지나치지 않음을 이번에 뼈저리게 느끼네요.

조회 수 :
11376
등록일 :
2010.12.17
10:00:44 (*.129.170.34)
엮인글 :
http://hosting.digimoon.net/board/36993/daa/trackback
게시글 주소 :
http://hosting.digimoon.net/board/36993

[레벨:15]id: 디지문디지문

2010.12.17
14:36:40
(*.129.170.34)

love2446, moonch 계정명 신청해 주신 분들을 찾습니다.

[레벨:0]moonch

2010.12.17
19:32:46
(*.202.141.16)

웹계정도 날아갔었네요~~~ㅎ

계정 다시 만들어서 댓글 달고 있는데 어떻게 하면 되나요~?

[레벨:15]id: 디지문디지문

2010.12.17
19:34:46
(*.74.175.5)

계정 신청글 다시 올려주시면 감사하겠습니다.

[레벨:0]moonch

2010.12.17
19:51:29
(*.202.141.16)

네 그렇게 할게요~~

[레벨:1]힐링12

2010.12.17
14:40:04
(*.41.241.33)

수고하셨습니다.

 

백업은 디지문 서버 분량도 중요하지만, 기본적으로 무료로 쓰는만큼 각자들 본인들의 홈페이지는 백업을 해야겠지요.

 

raid 콘트롤러는 해당 콘트롤러만 교체하면 하드디스크는 정상적으로 살아나야 할텐데,

(어차피 같은 어레이 콘트롤러이므로) 그 부분은 복구가 어려운가요?

[레벨:15]id: 디지문디지문

2010.12.17
14:41:55
(*.129.170.34)

레이드 어레이 정보는 컨트롤러에 저장되므로 같은 컨트롤러를 구한다고 해결될 일이 아닙니다.

List of Articles
번호 제목 글쓴이 날짜 조회 수
182 5/18(목) 장애 복구 완료 공지 [2] imagefile [레벨:15]id: 디지문디지문 2023-05-18 663
181 *.digimoon.net 와일드카드 SSL인증서 적용 [레벨:15]id: 디지문디지문 2021-01-20 880
180 디지문 서버 하드웨어 및 플랫폼 소프트웨어 변경 완료 안내 [1] [레벨:15]id: 디지문디지문 2018-04-01 2881
179 <서버 장애 공지> 1/22(일) 새벽에 데이터 유실 사고 공지 [1] [레벨:15]id: 디지문디지문 2017-01-30 3125
178 <완료> 서버 업그레이드 공지 [1] [레벨:15]id: 디지문디지문 2014-12-14 3879
177 <서버 장애 공지> 6/27 DB용 SDD 사망 장애 공지 [2] [레벨:15]id: 디지문디지문 2013-06-28 5605
176 <서버 장애 공지> 1/19~1/20 서버 네트웍 접속 불가 [4] [레벨:15]id: 디지문디지문 2013-01-20 4508
175 <중요 필독 공지> 국제망 과금 정책에 따른 후원호스팅 제도 도입에 관한 공지 [4] [레벨:15]id: 디지문디지문 2013-01-11 6356
174 <서버 이전 공지> 1/12 00시에 서버 이전합니다 (IP 변경됨) [4] [레벨:15]id: 디지문디지문 2013-01-06 6065
173 디지문호스팅이 5주년을 맞이했습니다. [8] [레벨:15]id: 디지문디지문 2012-10-20 6828
172 <서버 급작업 안내> DB 저장 영역을 SSD로 교체하였습니다 [2] [레벨:15]id: 디지문디지문 2012-08-17 7231
171 <완료>서버 렉 위치 변경 공지 [6] [레벨:15]id: 디지문디지문 2012-07-01 4695
170 4/28 회수 계정 명단입니다 [31] [레벨:15]id: 디지문디지문 2012-04-28 7670
169 <서버 급(?)업그레이드 보고> 2G-> 4G 램 업그레이드하였습니다. [16] [레벨:15]id: 디지문디지문 2011-11-25 9055
168 <서버 작업 공지> 11/24 21:00 서버 메인보드 교체 안내 [6] [레벨:15]id: 디지문디지문 2011-11-24 7823
167 <서버 작업 공지>10/29 23:00 서버 하드디스크 교체 작업 있습니다 [8] [레벨:15]id: 디지문디지문 2011-10-29 6879
166 디지문호스팅이 4주년을 맞이했습니다 [19] [레벨:15]id: 디지문디지문 2011-10-17 8325
165 앞으로 문의메일은 support@digimoon.net 으로 보내주세요 [레벨:15]id: 디지문디지문 2011-10-10 8755
164 <서버 급작업 공지> 서버 CPU 업그레이드 작업 또 있었습니다 [4] [레벨:15]id: 디지문디지문 2011-10-09 6733
163 <서버 작업 공지> 10월 5일 23:00 CPU 업그레이드 작업 있습니다. [5] [레벨:15]id: 디지문디지문 2011-10-05 5584
162 <서버 작업 공지> 9/8 Apache 업그레이드 일정 안내 [3] [레벨:15]id: 디지문디지문 2011-09-06 7652
161 <서버 장애 공지> 하드웨어 문제로 인한 서비스 단절 안내 [8] [레벨:15]id: 디지문디지문 2011-07-17 8596
160 5월 28일 회수 계정 명단입니다 [5] [레벨:15]id: 디지문디지문 2011-05-28 9831
159 <서버 장애 공지> 5/10 19시 16분경 장애 공지 [2] [레벨:15]id: 디지문디지문 2011-05-11 10192
158 <서버 장애 공지> 서버 파워와 메인보드 문제로 인한 접속 장애 공지 [2] imagefile [레벨:15]id: 디지문디지문 2011-05-10 11759
157 <서버 작업 공지> 5/7 20:00 하드디스크 추가 작업 공지 [1] [레벨:15]id: 디지문디지문 2011-05-07 10623
156 <서버 작업 공지> 4월 30일 하드 교체 작업 있습니다. [3] [레벨:15]id: 디지문디지문 2011-04-29 9357
155 <서버 이전 공지-완료> 금주 주말(3/11~3/13) 서버 이전 있을 예정입니다 [13] [레벨:15]id: 디지문디지문 2011-03-10 12216
154 3월 7일 22:00경 DDoS 공격 재발 [8] [레벨:15]id: 디지문디지문 2011-03-08 11995
153 3/13 저녁 시간대 서버 점검 작업이 있을 예정입니다 [1] [레벨:15]id: 디지문디지문 2011-03-05 10968