블로그 방명록 사전 갤러리 게시판 인클봇 인클챗 웹 IRC
 


지난주 수요일에 있었던 구글 I/O 컨퍼런스에서, 구글 직원 제프리 딘(Jeffrey Dean)이 구글 데이터 센터(클러스터)의 운영 방식에 대해 간략히 설명했습니다. 구글 데이터 센터는 전 세계에 36개가 있는 것으로 알려져 있습니다.

구글 데이터 센터

딘에 따르면, '보다 신뢰할 수 있는 하드웨어를 일정 개수 배치하는 것보다, 신뢰성은 다소 떨어지더라도 그보다 2배 많은 하드웨어를 배치하는 것이 더 좋다'고 합니다. '컴퓨터를 1만 대 운영한다고 하면, 매일 무언가가 고장나기' 때문에, '신뢰성은 소프트웨어 수준에서 제공하는 것이 좋다'는군요.

구체적인 통계도 제시했는데, 각 클러스터에서 처음 1년 동안 '컴퓨터 1000대가 고장나고, 하드 디스크 수천 개가 고장나며, 배전 장치(PDU) 하나가 고장나면서 컴퓨터 500~1000대를 6시간 가량 중단시키고, 랙 20개가 고장나면서 각각 컴퓨터 40~80대를 네트워크에서 사라지게 하고, 랙 5개가 이상 동작을 일으키면서 담당하고 있던 네트워크 패킷의 절반 가량이 손실됩니다.' 또한 '배선 변경이 한 번 있는데, 전체 컴퓨터 중 5%가 어느 순간 2일 가량 멈출 수 있습니다.' 마지막으로 '50% 확률로 전체 클러스터가 과열되어 5분 내로 서버 대부분이 다운되고, 복구하는 데 1~2일 걸릴 수 있습니다.'

구글의 값싼 하드웨어 대량 살포 정책(?)에 대해서는 익히 알고 있었지만, 구체적인 이야기를 들으니 재미있군요. 데이터 안정성은 서비스의 안정성으로 직결되니, 집착할 수밖에 없겠지요.

Posted by 랜덤여신

이 글의 관련글
2008/06/03 23:09 2008/06/03 23:09

Trackback URL : http://barosl.com/blog/trackback/759

Comments List

  1. 유듯무듯 2008/06/03 23:37 # M/D Reply Permalink

    완전 재밌습니다.
    영어를 못해서 이런 정보를 얻기가 어려운데
    이렇게 포스팅 해주시는 분을 보면 감사할 따름입니다.

  2. A2 2008/06/04 00:00 # M/D Reply Permalink

    오잉~ 그럴싸 한데요. ㅋ

  3. daybreaker 2008/06/04 02:19 # M/D Reply Permalink

    링크하신 글을 자세히 읽어보니 GFS의 경우 최소 3개의 서로 다른 머신에 64MB 단위의 데이터 블록을 분산 배치한다고 하는데, 확률적으로 그 3개가 동시에 고장나기는 힘들겠...지요?; 그런 경우는 어떻게 처리하려나 ...

    마지막에 현재 구글의 목표는 한 데이터센터 내에서 머신끼리의 데이터 이동을 구현하는 수준이 아니라 데이터센터끼리 주고받는 걸 원한다고 하는군요. 오호;;

  4. z0nKT1g3r 2008/06/04 15:10 # M/D Reply Permalink

    저도 갔다왔는데, 여러모로 초보인 저로서는 정말 많은걸 배울기회가 될 수 있어 좋았던것같습니다 ^^
    정말 유익하더군요!

  5. luzluna 2008/06/13 09:31 # M/D Reply Permalink

    GFS의 3개 세트가 동시에 고장나서 gmail의 데이터를 잃어버리는 사고가 적어도 한번이상 발생했었습니다... 유료 또는 중요한 데이터는 더 많이 분산하겠죠...

Leave a comment
[로그인][오픈아이디란?]
« Previous : 1 : ... 39 : 40 : 41 : 42 : 43 : 44 : 45 : 46 : 47 : ... 710 : Next »

블로그 이미지

랜덤여신이 살아가는 이야기입니다. / 국내 점유율이 1%도 안 되는 리눅스 관련 글을 주로 씁니다. 관심 좀... ㅠㅠ / 컴퓨터쪽 이야기도 씁니다.

- 랜덤여신

Recent Posts

  1. 네이버, 나눔글꼴 공개 - 한글날 기념 (7)
  2. 애플, 아이폰 NDA 폐지 (4)
  3. 파이썬 2.6 발표 (2)
  4. 구글 크롬 탄생 - 몇 가지 특징 (10)
  5. ReiserFS 개발자 한스 라이저, 징역 15... (5)
  6. PHP 4, 개발 중단 (4)
  7. 동화 같은 README 파일 (6)
  8. 아무 기능도 없는 '나는 부자다' 아이폰... (10)
  9. 리눅스 사용자, 급팽창 중 (12)
  10. 파이어폭스, Qt 이식 성공 (5)
  11. IBM, 리눅스 데스크톱 제작사들과 제휴... (6)
  12. 파이어폭스 3의 달라진 SSL 정책, 웹을... (16)
  13. 야후, 서비스 중단으로 재생할 수 없게... (1)
  14. 파이어폭스 개발자 모임, 낙석으로 갇히... (3)
  15. 리눅스 커널에 대한 신화, 거짓, 그리고... (7)
  16. 자기가 만든 프로그램에 해킹당하다 - H... (2)
  17. 컴피즈의 어머니 XGL, 개발 중단 (1)
  18. KDE 4.1 발표 - 일반 사용자를 위한 첫...
  19. 구글 코드, MPL 라이선스 사용 금지 (1)
  20. MS 워드 95에서 2007까지 성능 비교 (9)
  21. 두 번째 맥 클론 제작사 등장 - 오픈 테크 (8)
  22. 리눅스 커널에 대한 신화, 거짓, 그리고... (17)
  23. 오픈웹, 금융결제원 상대로 1심 패소 (9)
  24. 구글, 실명 기반 위키 '놀(Knol)' 공개... (3)
  25. 해킹도 하고 직업도 얻고 (4)
  26. 파이어폭스, 1등 안 노려 - 인터넷 익스... (22)
  27. '콜드 부트 공격' 예제 발표 - 전원 꺼... (6)
  28. 패치하지 않은 윈도우 PC의 생존 시간 -... (6)
  29. GNOME 창시자 미겔, GTK+ 3.0 구상 비판
  30. Gmail로 보내는 스팸 급격히 증가 (2)