한국레드햇 너나우리 DNSEver qmail.kldp.org 어드민플레이

안녕하세요, 영자 디지문입니다.

 

여러분들께 좀 안 좋은 소식을 들려드리게 되어 죄송하고 또 죄송할 따름입니다.

 

어제 16일 14시 이후부터 서버가 또 말썽을 일으키더군요. 서비스 접속 안 되고 네트워크 핑만 되는 상태가 다시 발생하였습니다.

 

그런데 이번엔 종전보다 증상이 약간 달랐습니다. 아파치 웹서버는 살아 있는데 DB를 긁어 출력해야 하는 웹페이지가 출력이 안 되는 현상이 나타나더군요. 서버 상태를 보려 해도 SSH나 FTP 모두 접속이 되지 않는 것이었습니다.

 

17일 00시 50분 간신히 서버를 다시 올릴 수 있었습니다. 피시방 사장님께서 외출 나갔다 복귀하시자마자 밤새 수고해 주셔서 겨우 올릴 수 있었습니다.

 

그러나...

 

 

 

 

서버에서 레이드 컨트롤러가 인식되지 않는 것이었습니다.

 

다른 메인보드에 장착해 보아도 인식되지 않았습니다.

 

그렇습니다. 컨트롤러 자체가 나간 것이었습니다. 컨트롤러의 롬바이오스 칩이 나간 것으로 추정됩니다.

 

하드디스크 물리적 장애에 대비하고자 레이드 컨트롤러를 도입한 것인데 사실 레이드 컨트롤러 자체가 나가면 답이 없긴 합니다. 하지만 여타 부품에 비해 고장나는 빈도가 낮은 축에 속하는 부품인지라 신뢰하며 사용해 왔던 게 사실입니다.

 

레이드 컨트롤러에 연결된 하드디스크의 컨디션은 제대로 체크하더라도 정작 컨트롤러 자신의 컨디션은 제대로 체크 못하나 봅니다. 한 방에 그냥 훅 가네요. ㅡ,.ㅡ;;

 

레이드 컨트롤러에 연결된 레이드 어레이 쪽에 /home, MySQL 디비를 모두 위치시켜 놓고 운영하고 있었습니다. 하드디스크에 장애가 나더라도 서비스 중단 시간을 최대한 절감하자는 목적으로 레이트 어레이에 갱신 빈도가 가장 잦은 /home과 MySQL 디비를 위치시켜 놓은 것이죠.

 

그리고 물리적으로 다른 하드디스크에 하루 한 번씩 주기 백업도 해주면서 만약의 사태에 이중으로 대비하고 있었습니다.

 

레이드 컨트롤러는 그렇다 치고 더욱 문제가 되는 것이 하필 이번 하드웨어 장애가 빈번하게 일어나는 와중에 백업용 하드디스크가 자꾸 인식이 되었다 말았다 하는 증상이 나타나는 것입니다.

 

하드웨어 문제가 하도 골치라서 안 그래도 서버에 연결된 하드디스크 수를 최소화시키고 메인보드도 교체할 계획이었습니다.

 

지난 일주일 동안 잠시 백업본도 레이드 어레이 쪽에 저장되도록 운영하고 있었는데 손을 써보기도 전에 하필 장애가 발생해 버렸습니다. ㅜ,.ㅜ;;

 

최신 백업본마저 소멸되었다는 얘기입니다.

 

 

 

다행이 일주일 전에 12월 12일에 원격으로 백업을 받아놓은 데이터가 있어서 지금 그것으로 복구하고 있는 중입니다.

 

백업본 하나만큼은 자신 있다고 큰소리 쳐왔건만 이렇게 최악의 경우의 수를 만나 버리고 말았습니다.

 

레이드 컨트롤러 자체가 나가질 않나~ 하필 그 동안 백업용 하드디스크마저 문제가 있었질 않나...

 

지금 사무실에서 업무를 보는 틈틈히 복원 작업하고 있습니다. 아직 제대로 출력되지 않는 홈피들이 다수 있습니다. 완전히 다 끝나면 다시 재공지토록 하겠습니다.

 

 

 

 

--------------------------------------------------------------------------------------

 

 

17일 11시 30분에 1차 복원 작업 완료하였습니다. 제가 원격백업해 두었던 자료가 아마 12월 12일이나 13일 자료일 겁니다.

 

홈페이지에 이상한 에러 문구가 떠 있다거나 게시판 로그인이 안 되는 증상이 있는 등의 문제가 있는 분들께선 서슴없이 문의 주시기 바랍니다.

 

정말 죄송합니다. 백업의 중요성은 아무리 강조해도 지나치지 않음을 이번에 뼈저리게 느끼네요.

조회 수 :
11375
등록일 :
2010.12.17
10:00:44 (*.129.170.34)
엮인글 :
http://hosting.digimoon.net/board/36993/13f/trackback
게시글 주소 :
http://hosting.digimoon.net/board/36993

[레벨:15]id: 디지문디지문

2010.12.17
14:36:40
(*.129.170.34)

love2446, moonch 계정명 신청해 주신 분들을 찾습니다.

[레벨:0]moonch

2010.12.17
19:32:46
(*.202.141.16)

웹계정도 날아갔었네요~~~ㅎ

계정 다시 만들어서 댓글 달고 있는데 어떻게 하면 되나요~?

[레벨:15]id: 디지문디지문

2010.12.17
19:34:46
(*.74.175.5)

계정 신청글 다시 올려주시면 감사하겠습니다.

[레벨:0]moonch

2010.12.17
19:51:29
(*.202.141.16)

네 그렇게 할게요~~

[레벨:1]힐링12

2010.12.17
14:40:04
(*.41.241.33)

수고하셨습니다.

 

백업은 디지문 서버 분량도 중요하지만, 기본적으로 무료로 쓰는만큼 각자들 본인들의 홈페이지는 백업을 해야겠지요.

 

raid 콘트롤러는 해당 콘트롤러만 교체하면 하드디스크는 정상적으로 살아나야 할텐데,

(어차피 같은 어레이 콘트롤러이므로) 그 부분은 복구가 어려운가요?

[레벨:15]id: 디지문디지문

2010.12.17
14:41:55
(*.129.170.34)

레이드 어레이 정보는 컨트롤러에 저장되므로 같은 컨트롤러를 구한다고 해결될 일이 아닙니다.

List of Articles
번호 제목 글쓴이 날짜 조회 수
152 <서비스 일시 중단 공지> 서버 보안 점검 중입니다 [15] [레벨:15]id: 디지문디지문 2011-02-16 15045
151 <서버 장애 공지> DDoS 공격이 있었습니다 [10] imagefile [레벨:15]id: 디지문디지문 2011-02-14 13931
» <서버 장애 공지> 죄송하고 또 죄송합니다... 좀 큰 문제입니다 [6] [레벨:15]id: 디지문디지문 2010-12-17 11375
149 <서버 장애 공지> 24시간 가까이 서비스 중단된 사연 안내 [7] [레벨:15]id: 디지문디지문 2010-12-05 11374
148 11월 28일, 29일 서버 장애 안내 [2] [레벨:15]id: 디지문디지문 2010-11-30 14301
147 2010년 11월 27일 계정 발급 다시 시작합니다 [레벨:15]id: 디지문디지문 2010-11-27 9850
146 10월 17일은 디지문호스팅 생일입니다!!! [10] [레벨:15]id: 디지문디지문 2010-10-17 21304
145 9월 9일 서버 장애 공지입니다 imagefile [레벨:15]id: 디지문디지문 2010-09-10 10502
144 계정 발급을 당분간 중단합니다 [2] [레벨:15]id: 디지문디지문 2010-08-20 10346
143 7월 26일 회수 계정 명단입니다 [2] [레벨:15]id: 디지문디지문 2010-07-26 10511
142 <필독 중요 공지> 7월 17일 am 01:00 서버 이전 공지 [4] [레벨:15]id: 디지문디지문 2010-07-02 9416
141 6월 7일~21일 회원가입 실패하신 분들께 알립니다 [레벨:15]id: 디지문디지문 2010-06-21 9986
140 <6월 7일 22:00 서버 장애 복원 공지> [10] imagefile [레벨:15]id: 디지문디지문 2010-06-07 10494
139 5월 29일 기술지원 일시 불가 안내 [레벨:15]id: 디지문디지문 2010-05-28 8479
138 <17일 08시 서버 장애 복원 공지> [4] imagefile [레벨:15]id: 디지문디지문 2010-05-17 9007
137 비툴 사이트 입주를 금지합니다. [레벨:15]id: 디지문디지문 2010-05-09 11762
136 서버 장애 공지입니다(하드디스크 문제) [4] [레벨:15]id: 디지문디지문 2010-03-29 9580
135 백업 시간이 길어지고 있어 입주자 여러분의 협조를 구합니다 [레벨:15]id: 디지문디지문 2010-03-09 9072
134 3월 4일 하드디스크 입출력 오류 증상이 있었습니다 [레벨:15]id: 디지문디지문 2010-03-04 10230
133 (긴급 공지) 제로보드 4.X 심각한 취약점 발견 [1] [레벨:15]id: 디지문디지문 2010-02-24 13178
132 2월 4일부터 한메일로 메일 발송이 안 되는 문제 발생 [1] [레벨:15]id: 디지문디지문 2010-02-21 12043
131 2얼 17일 회수 계정 명단입니다 [1] [레벨:15]id: 디지문디지문 2010-02-17 9453
130 1월 25일 ~ 2월 12일 호스팅 회원가입 실패하신 분들께 공지드립니다 [레벨:15]id: 디지문디지문 2010-02-12 7232
129 <중요 공지>suPHP 도입 예정입니다. [3] [레벨:15]id: 디지문디지문 2010-02-05 9129
128 서버 다운 있었습니다 [레벨:15]id: 디지문디지문 2010-01-26 8424
127 <서버 이전 완료>서버 이전 날짜 확정 공지입니다 [7] [레벨:15]id: 디지문디지문 2010-01-24 10653
126 <필독 공지>원활한 서버 이전을 위한 퍼블릭도메인 설정 안내입니다. imagefile [레벨:15]id: 디지문디지문 2010-01-22 11861
125 <필독 공지>한시적으로 트래픽을 제한합니다. [5] [레벨:15]id: 디지문디지문 2010-01-20 8184
124 <중대 발표>디지문호스팅 서버 이전 계획입니다 [12] [레벨:15]id: 디지문디지문 2010-01-14 10166
123 <해결>한메일로 메일 발송이 안 되는 문제 [1] [레벨:15]id: 디지문디지문 2010-01-09 7162