System/Common

Lustre 파일시스템이란?

linuxism 2012. 10. 27. 15:41


HPC (High Performance Computing) 분야에서 주로 사용되는 파일시스템으로 분산 (distributed) 병렬 (parallel), 클러스터 파일시스템으로 정의될 수 있다. 가장 중요한 특징으로는 GNU GPL을 준수하는 Open Source Software로 특정 하드웨어, 업체 종속적이지 않고 일반적인 x86 시스템만으로 구성가능한 분산 파일시스템이라고 할 수 있다.
또한 일반적인 네트워크 파일시스템 (NFS) 기반의 NAS와 동일하게 POSIX 규준을 준수하며, 어떠한 Client 에게도 동일한 Namespace 를 제공하는 Global Shared 파일시스템이다. 그 외의 중요한 특징으로는 저장단위가 파일이나 디스크 블럭이 아닌 Object 기반으로, 모든 I/O의 단위는 Object 단위로 분산 저장될 수 있으며, 병렬 I/O 를 지원하여 대형 Cluster 시스템에서 최대의 성능을 낼 수 있도록 설계되어 있다.

1990년대 말 Carnegie Melon 대학교의 Coda 분산파일시스템 프로젝트에서 파생된 Linux 기반 병렬 분산 파일시스템으로, 대학교, 연구소 등에서 널리 사용되어 왔으며, 2000년대 중반 고성능 Interconnect 네트워크인 Infiniband 의 보급과 함께 많은 경쟁자를 도태시키며, 무한대의 용량확장, 성능 확장 기능으로 Exa-scale Computing 시대의 스토리지 시스템으로써 거의 유일한 대안으로 여겨지게 된 고성능 파일 시스템이다.

세계적인 HPC 시스템 리스트인 top500.org 에 따르면 상위 10개 사이트 중 8개가, 상위 100개 사이트 중 65개가 사용중이다. (2010년 11월 SC10 에서 발표된 top500 리스트 기준이며, 2011년 6월 ISC11 에서 새로 업데이트 될 예정이다.)

그 중 유명한 사이트 리스트는 다음과 같다.

1위 : Tianhe-1A (중국 국방과학기술대학) 약 1PB

2위 : Jaguar-Cray XT5-HE (미국 DOE/SC/Oak Ridge National Laboratory) 약 10.7PB

4위 : TSUBAME 2.0 (일본 동경과학기술대학, TITech) 약 6PB

6위 : TERA-100 (프랑스 Commissariat a l'Energie Atomique : CEA) 약 15+PB

7위 : Roadrunner (미국 DOE/NNSA/LANL) 약 10+PB

8위 : Kraken XT5 (미국 National Institute for Computational Sciences/University of Tennessee) 약 3.3PB

9위 : JUGENE (독일 Forschungszentrum Juelich : FZJ) 약 1.8PB

12, 13, 15, 16, 22, 23, 25, 26, 29, 30위

19위/20위 : 해담/해온 (한국 기상청) 약 2PB

24위 : TACHYON-2 (한국 과학기술정보연구원) 약 1.7PB


현재, Lustre 파일 시스템은 Oracle 사가 소유한 Trademark 이다.
(Currently, Lustre is a registered trademark owned by Oracle America.)
 

출처 - http://lustrekr.tistory.com/2