AWS에서 Amazon S3 버킷에 대한 쿼리 가능한 객체 메타데이터(미리 보기) 출시를 발표했습니다. 이 기능을 사용하면 Athena, Redshift, QuickSight, Spark 등 Iceberg 호환 도구를 사용하여 S3 버킷의 객체 메타데이터를 쿼리할 수 있습니다. 키, 크기, 태그 등의 특정 기준에 따라 객체를 검색할 수 있으므로 S3에서 대량의 데이터를 관리하는 문제를 해결할 수 있습니다. 이 기능을 통해 사용자는 데이터 분석, 데이터 처리 및 AI 교육 워크플로우를 개선할 수 있습니다. 이 기능의 흥미로운 측면은 S3 객체가 추가되거나 수정될 때 풍부한 메타데이터를 자동으로 캡처할 수 있다는 것입니다. 이 메타데이터는 완전히 관리되는 Apache Iceberg 테이블에 저장되므로 효율적인 쿼리가 가능합니다. 이는 대규모 데이터 세트를 저장하기 위해 S3를 사용하고 해당 데이터 세트 내에서 특정 객체를 찾는 효율적인 방법이 필요한 조직에 특히 유용합니다. 이 기능은 데이터 검색을 간소화하고 전반적인 효율성을 향상합니다.