생성형 AI 스타트업인 Fireworks.ai는 지금까지 가장 빠르고 효율적인 추론 엔진을 출시했습니다. 이 회사는 기존의 단일 AI 모델을 여러 개의 상호 작용 모델로 대체하는 복합 AI 시스템을 사용합니다. Fireworks.ai는 비용 효율적이고 확장 가능한 솔루션을 제공하기 위해 Google Cloud 및 NVIDIA와 같은 파트너와 협력하고 있습니다. Google Cloud는 Fireworks.ai가 99.99% API 가동 시간으로 매일 1,400억 개 이상의 토큰을 처리하는 데 도움을 주고 있습니다. Fireworks.ai는 성능을 최적화하고 비용을 절감하기 위해 Cloud Pub/Sub, Cloud Functions, Cloud Monitoring, BigQuery 등의 Google Cloud 서비스도 사용합니다. 이 파트너십 덕분에 Fireworks.ai는 경쟁 호스팅 서비스에 비해 4배 낮은 지연 시간과 4배 높은 처리량을 제공할 수 있습니다. Fireworks.ai는 AI에 대한 오픈 소스 액세스의 중요성을 강조하며 더 많은 기업이 생성형 AI의 혁신적인 사용을 통해 가치를 창출할 수 있도록 Google Cloud와 협력하고 있습니다.
Fireworks.ai와 Google Cloud: 생성형 AI 혁신을 강화
Google Cloud