글 수 182
또 불시에 서버 점검 작업이 있었습니다.
호스팅 이용하시는 데 이렇게 차질을 자꾸 빚게 해 드려 번번히 죄송할 따름입니다.
다행히도 이번 점검 건은 새벽밤에 이루어진 지라 지난 번처럼 백주대낮에 서버가 뻗었던 경우보단 여러분들께 큰 피해가 가진 않았을 거 같습니다.
사실 굳이 서버 점검 하느라 1-2시간 이상씩 허비할 필요도 없는 작업이었습니다. 그냥 리부팅만 한 번 해 주면 간단한 것이었습니다.
하지만 최근 들어 자꾸 서버가 죽는 일이 빈번해져서 극약 처방이 필요할 거 같아 시간을 좀 들였습니다.
서버가 어떻게 자꾸 죽었냐 하면... 서버의 로그 기록과 증상을 봐서는 I/O(입출력) 에러임이 분명했습니다.
디지문호스팅 서버는 펜티엄3 시스템입니다. 펜3 메인보드는 SATA 인터페이스를 지원하지 않습니다.
허나 PCI슬롯에 SATA컨트롤러를 부착하여 사타 인터페이스를 활용, 사타하드로 돌리고 있습니다.
이 SATA 컨트롤러에서 문제가 발생하는 걸로 진단을 내렸습니다.
서버가 죽었을 때의 증상을 보면 케이스의 HDD LED가 깜빡깜빡거리는 것도 아니고 계속 불이 들어온 상태가 계속됩니다.
그리고 서버에 할당한 사설IP주소로 핑을 때려 보면 희한하게 핑은 정상적으로 갑니다.
이는 네트워크 어댑터는 살아 있으되 하드디스크 입출력 단에 문제가 발생한 것으로 진단을 내릴 수 있는 거죠.
하드디스크 자체가 죽었다면 그 하드는 아예 쓸 수가 없죠. 하드는 고장났다 다시 살아날 리 만무한 장치입니다.
결국 사타 컨트롤러가 일시적으로 기능을 상실하는 것으로 판단할 수 밖에 없더군요.
지금 사용하고 있는 컨트롤러의 칩셋인 실리콘이미지 칩셋은 ATA 컨트롤 칩셋 중에서 저가형에 속합니다. 말 그대로 싸구려라는 얘기죠.
RAID 기능도 지원하긴 하는데 저가형이라 신뢰성이 상당히 떨어집니다. 그래서 단순 사타 포트 확장 용도로만 쓰는 게 정신건강상 이롭다고 써 본 경험자들이 특히 강조합니다.
그래서 여태 단순 사타포트 확장용으로만으로도 1년 가까이 잘 쓰고 있었는데 최근에 500기가 하드를 하나 영입하면서 컨트롤러의 4개 포트가 꽉 차게 되었습니다.
인터넷에서 정보를 검색해 본 결과 현 사타컨트롤러의 칩셋인 Silicon Image 칩셋의 경우 프로세스 메모리 점유율이 계속 증가하여 물리 메모리를 넘어서게 되면 리소스 부족 오류가 발생할 수 있다고 합니다.
포트 4개에 하드를 풀로 연결하면서부터 서버가 죽는 경우가 빈번해졌습니다. 500기가를 추가한 지 한 달 정도 된 거 같은데 벌써 열 번 가까이 서버가 죽어서 리부팅을 반복했던 것 같네요.
서버 로그 기록을 살펴보면 서버가 죽기 직전 시간대까지 서버에서 무슨 작업이 이루어졌나를 확인할 수 있습니다.
서버에 접속에서 FTP로 파일을 자주 올려받고 내려받고 하는 작업이 항상 빈번하게 이루어지고 있었습니다.
수십 킬로바이트 정도의 저용량 웹페이지 파일들이 오르락내리락 하는 정도의 부하가 걸리면 컨트롤러 칩셋엔 별 무리를 주지 않는 걸로 보입니다. 하지만 수 메가에서 수십, 수백 메가 안팎의 파일들의 입출력 작업이 자주 이루어지면 결국 칩셋에 무리가 가는 모양이더군요.
주로 서버의 FTP 익명 서버에 접속해서 자료를 받아가는 경우가 잦을수록 서버의 입출력 에러 발생의 빈도가 잦아지는 것 같습니다. 그러므로 입주자 여러분들이 호스팅 계정을 이용하면서 FTP로 웹페이지 파일과 음악 파일 올리는 정도는 괜찮다는 겁니다.
거기다가 컨트롤러에 하드를 많이 달면 달수록 칩셋이 프로세싱을 하는 데 부하가 더 많이 걸리는 모양입니다.
그래서 웬만하면 앞으로 컨트롤러에 하드를 4개 풀로 달지는 않을 계획입니다. 3개 정도가 마지노선인 것 같습니다.
입수한 정보로는 칩셋의 펌웨어 버전을 업그레이드하면 해결될 수도 있다 하는데 골치 아파서 그냥 하드 3개만 달고 끝내려 합니다.
그래서 새벽 동안 작업한 게 하드를 하나 줄이고 그 제거한 하드의 자료를 남아 있는 하드에 옮기는 것이었습니다.
단순히 옮기기만 한 건 아닙니다. 파티션까지 분할 조정하는 등의 고된 작업(?)이 있었죠.
리눅스용 파일시스템인 ext3로 포맷된 파티션의 경우 용량 조절하는 데 윈도용 파일시스템으로 포맷된 하드보다 시간이 훨씬 오래 걸리더군요.
암튼 이젠 서버가 좀 안정을 되찾을 것으로 기대하고 있습니다.
그래도 에러가 계속된다면??? 시스템을 갈아 엎던가 해야죠. 돈을 들여서라도 ... ^^;;
암튼 안정된 호스팅을 하기 위해 최선을 다하도록 하겠습니다. 즐거운 나날 되십시오.
호스팅 이용하시는 데 이렇게 차질을 자꾸 빚게 해 드려 번번히 죄송할 따름입니다.
다행히도 이번 점검 건은 새벽밤에 이루어진 지라 지난 번처럼 백주대낮에 서버가 뻗었던 경우보단 여러분들께 큰 피해가 가진 않았을 거 같습니다.
사실 굳이 서버 점검 하느라 1-2시간 이상씩 허비할 필요도 없는 작업이었습니다. 그냥 리부팅만 한 번 해 주면 간단한 것이었습니다.
하지만 최근 들어 자꾸 서버가 죽는 일이 빈번해져서 극약 처방이 필요할 거 같아 시간을 좀 들였습니다.
서버가 어떻게 자꾸 죽었냐 하면... 서버의 로그 기록과 증상을 봐서는 I/O(입출력) 에러임이 분명했습니다.
디지문호스팅 서버는 펜티엄3 시스템입니다. 펜3 메인보드는 SATA 인터페이스를 지원하지 않습니다.
허나 PCI슬롯에 SATA컨트롤러를 부착하여 사타 인터페이스를 활용, 사타하드로 돌리고 있습니다.
이 SATA 컨트롤러에서 문제가 발생하는 걸로 진단을 내렸습니다.
서버가 죽었을 때의 증상을 보면 케이스의 HDD LED가 깜빡깜빡거리는 것도 아니고 계속 불이 들어온 상태가 계속됩니다.
그리고 서버에 할당한 사설IP주소로 핑을 때려 보면 희한하게 핑은 정상적으로 갑니다.
이는 네트워크 어댑터는 살아 있으되 하드디스크 입출력 단에 문제가 발생한 것으로 진단을 내릴 수 있는 거죠.
하드디스크 자체가 죽었다면 그 하드는 아예 쓸 수가 없죠. 하드는 고장났다 다시 살아날 리 만무한 장치입니다.
결국 사타 컨트롤러가 일시적으로 기능을 상실하는 것으로 판단할 수 밖에 없더군요.
지금 사용하고 있는 컨트롤러의 칩셋인 실리콘이미지 칩셋은 ATA 컨트롤 칩셋 중에서 저가형에 속합니다. 말 그대로 싸구려라는 얘기죠.
RAID 기능도 지원하긴 하는데 저가형이라 신뢰성이 상당히 떨어집니다. 그래서 단순 사타 포트 확장 용도로만 쓰는 게 정신건강상 이롭다고 써 본 경험자들이 특히 강조합니다.
그래서 여태 단순 사타포트 확장용으로만으로도 1년 가까이 잘 쓰고 있었는데 최근에 500기가 하드를 하나 영입하면서 컨트롤러의 4개 포트가 꽉 차게 되었습니다.
인터넷에서 정보를 검색해 본 결과 현 사타컨트롤러의 칩셋인 Silicon Image 칩셋의 경우 프로세스 메모리 점유율이 계속 증가하여 물리 메모리를 넘어서게 되면 리소스 부족 오류가 발생할 수 있다고 합니다.
포트 4개에 하드를 풀로 연결하면서부터 서버가 죽는 경우가 빈번해졌습니다. 500기가를 추가한 지 한 달 정도 된 거 같은데 벌써 열 번 가까이 서버가 죽어서 리부팅을 반복했던 것 같네요.
서버 로그 기록을 살펴보면 서버가 죽기 직전 시간대까지 서버에서 무슨 작업이 이루어졌나를 확인할 수 있습니다.
서버에 접속에서 FTP로 파일을 자주 올려받고 내려받고 하는 작업이 항상 빈번하게 이루어지고 있었습니다.
수십 킬로바이트 정도의 저용량 웹페이지 파일들이 오르락내리락 하는 정도의 부하가 걸리면 컨트롤러 칩셋엔 별 무리를 주지 않는 걸로 보입니다. 하지만 수 메가에서 수십, 수백 메가 안팎의 파일들의 입출력 작업이 자주 이루어지면 결국 칩셋에 무리가 가는 모양이더군요.
주로 서버의 FTP 익명 서버에 접속해서 자료를 받아가는 경우가 잦을수록 서버의 입출력 에러 발생의 빈도가 잦아지는 것 같습니다. 그러므로 입주자 여러분들이 호스팅 계정을 이용하면서 FTP로 웹페이지 파일과 음악 파일 올리는 정도는 괜찮다는 겁니다.
거기다가 컨트롤러에 하드를 많이 달면 달수록 칩셋이 프로세싱을 하는 데 부하가 더 많이 걸리는 모양입니다.
그래서 웬만하면 앞으로 컨트롤러에 하드를 4개 풀로 달지는 않을 계획입니다. 3개 정도가 마지노선인 것 같습니다.
입수한 정보로는 칩셋의 펌웨어 버전을 업그레이드하면 해결될 수도 있다 하는데 골치 아파서 그냥 하드 3개만 달고 끝내려 합니다.
그래서 새벽 동안 작업한 게 하드를 하나 줄이고 그 제거한 하드의 자료를 남아 있는 하드에 옮기는 것이었습니다.
단순히 옮기기만 한 건 아닙니다. 파티션까지 분할 조정하는 등의 고된 작업(?)이 있었죠.
리눅스용 파일시스템인 ext3로 포맷된 파티션의 경우 용량 조절하는 데 윈도용 파일시스템으로 포맷된 하드보다 시간이 훨씬 오래 걸리더군요.
암튼 이젠 서버가 좀 안정을 되찾을 것으로 기대하고 있습니다.
그래도 에러가 계속된다면??? 시스템을 갈아 엎던가 해야죠. 돈을 들여서라도 ... ^^;;
암튼 안정된 호스팅을 하기 위해 최선을 다하도록 하겠습니다. 즐거운 나날 되십시오.