Google Cloud는 Cloud HPC Toolkit의 이름을 Cluster Toolkit으로 변경하고 AI/ML 워크로드를 포괄하도록 범위를 확장했다고 발표했습니다. 이 툴킷은 Google Cloud에서 고성능 컴퓨팅 환경을 손쉽게 생성하고 관리할 수 있도록 지원합니다.

이러한 변화는 과학 및 기술 컴퓨팅에서 AI/ML 애플리케이션에 이르기까지 다양한 분야에서 Cluster Toolkit이 널리 채택되고 있음을 반영합니다.

Cluster Toolkit은 클러스터 설정 및 배포를 간소화하여 사용자가 인프라 관리가 아닌 워크로드에 집중할 수 있도록 지원합니다. 또한 Slurm, GKE, Batch와 같은 여러 스케줄러를 지원하여 다양한 컴퓨팅 작업에 유연성을 제공합니다.

Cluster Toolkit의 주요 이점은 다음과 같습니다.

* 손쉬운 클러스터 배포 및 관리

* HPC 및 AI/ML 워크로드를 위한 빠른 시작 옵션

* Google Cloud 권장사항 통합

* 정기적인 업데이트 및 새로운 기능

* 오픈소스 접근성

Cluster Toolkit의 새로운 기능 중 일부는 다음과 같습니다.

* A3 메가 블루프린트: 대규모 언어 모델(LLM) 및 기타 AI/ML 워크로드를 학습할 준비가 된 A3 메가 VM 클러스터를 배포합니다.

* HPC VM 이미지: 인기 있는 HPC 도구 및 라이브러리가 사전 설치된 VM 이미지입니다.

* Slurm-gcp v6: Google Cloud에서 Slurm 워크로드를 원활하게 실행할 수 있는 Slurm-gcp 솔루션의 최신 버전입니다.

혼동을 피하려면 로컬 클론 및 명령어 이름을 업데이트하는 것이 좋습니다.

Cluster Toolkit을 시작하려면 GitHub 저장소에서 제공되는 사용하기 쉬운 HPC 및 AI/ML 블루프린트 중 하나를 선택하고 이를 사용하여 클러스터를 설정하세요. 또한 문서, 빠른 시작, 동영상 등 시작하는 데 도움이 되는 다양한 리소스를 제공합니다.