Google Cloud는 Gretel 및 BigQuery DataFrames를 사용하여 합성 데이터를 생성하는 실용적인 가이드를 게시했습니다. 이 가이드에서는 합성 데이터 생성의 기술적 측면을 심층적으로 살펴보고 높은 데이터 품질, 개인정보 보호 및 개인정보 보호 규정 준수를 보장하는 데 중점을 둡니다. BigQuery 환자 기록 테이블을 사용하여 작업을 시작하고 파트 1에서 데이터의 익명화를 수행한 다음 파트 2에서 BigQuery에 다시 저장하기 위해 합성 데이터를 생성합니다. 이 가이드에서는 Gretel 및 BigQuery DataFrames 도구 설치 및 구성, 개인 식별 정보(PII) 익명화를 위한 Gretel Transform v2 사용 방법 등 중요한 측면에 대해서도 설명합니다. 또한 Gretel의 Navigator Fine Tuning(NavFT)을 사용하여 데이터세트에서 사전 학습된 모델을 미세 조정하여 고품질의 도메인별 합성 데이터를 생성하는 방법도 보여줍니다. 가이드에는 Gretel과 BigQuery를 사용하는 방법에 대한 코드 예제와 팁도 포함되어 있습니다. 이 가이드를 따르면 사용자는 데이터 프라이버시 및 규정 준수를 보장하면서 데이터 과학, 분석 및 AI 개발 워크플로를 개선하기 위한 합성 데이터의 기능을 활용할 수 있습니다.