Google Cloud는 Gemini 및 BigQuery를 사용한 NL2SQL(자연어를 SQL로 변환) 출시를 발표했습니다. 이 기술은 비기술적 사용자가 특수 SQL 지식 없이도 데이터베이스와 상호 작용하고, 데이터를 탐색하고, 자체적으로 통계를 얻을 수 있도록 하여 데이터와 상호 작용하는 방식을 혁신할 수 있는 잠재력을 가지고 있습니다. 하지만 NL2SQL이 널리 채택되기 어렵게 만드는 몇 가지 문제가 있습니다. 이러한 문제에는 데이터 형식 변형, 의미적 모호성, SQL의 구문적 경직성, 맞춤 비즈니스 측정항목 등이 포함됩니다. 이 블로그 게시물에서는 Google Cloud의 NL2SQL 솔루션과 구현을 위한 권장사항을 살펴봅니다. 사용자가 직면하는 몇 가지 문제에는 모호하거나 불충분하게 지정된 질문 또는 다단계 분석이 필요한 복잡한 질문이 포함됩니다. 이러한 문제를 해결하기 위해 Gemini Flash 1.5는 복잡성에 따라 질문을 분류하는 라우팅 에이전트로 설계되었습니다. 질문이 분류되면 모호성 검사, 벡터 임베딩, 의미론적 검색, 기여 분석 모델링과 같은 기술을 사용하여 출력을 개선할 수 있습니다. Google Cloud는 작동하는 NL2SQL 솔루션을 구현하는 데 도움이 되는 전체 도구를 사용합니다. 이러한 도구에는 BigQuery 벡터 검색을 사용한 벡터 임베딩 및 검색, BigQuery 기여 분석, Gemini를 사용한 모호성 검사 등이 포함됩니다. NL2SQL 권장사항에는 답변할 질문으로 시작, 데이터 전처리, 사용자 의견 및 반복을 통한 SQL 개선 연습, 다단계 쿼리에 맞춤 흐름 사용 등이 포함됩니다.