아카이브로 돌아가기

AI 뉴스레터 - 2026-02-06 (금)

게시일:2026년 2월 6일읽기 시간:11영상 수:7개 영상총 조회수:0회 조회

오늘의 요약

2026-02-06 딥다이브: BUILD 2025 Opening Keynote: Building the Agentic A

상세 내용

BUILD 2025 Opening Keynote: Building the Agentic AI Future

BUILD 2025 Opening Keynote: Building the Agentic AI Future

BUILD 2025 Opening Keynote: Building the Agentic AI Future

Snowflake Inc. · 조회수 62,203

📺 영상 보기


회사 데이터로 진짜 답하는 AI

사내 데이터에 바로 붙어 일하는 AI예요. 그냥 검색이 아니라, 권한이 있는 테이블과 문서를 이해하고, 왜 그런 답이 나왔는지 SQL과 출처까지 보여줘요. 그래서 “그럴 듯한 말”이 아니라 회의에서 바로 써먹을 수 있는 답을 내요.

📺 영상 보기 | Snowflake Inc. | 조회수 62,203


서비스 개요

Snowflake Intelligence라는 데이터 에이전트 플랫폼이에요. 회사 안의 정형 데이터와 문서, 이미지, 오디오까지 한데 모아 이해하고, 자연어 질문을 SQL·파이썬·dbt 모델로 바꿔 실행해 인사이트와 차트를 내고 근거를 함께 보여줘요.

보통 챗봇은 문서를 긁어 요약만 하거나, 데이터베이스는 쿼리만 해요. Snowflake는 시맨틱 뷰라는 비즈니스 용어 레이어, Cortex Search라는 비정형 검색, 그리고 검증된 쿼리 묶음을 한 화면에서 엮어줘요. “지난주 샌디에이고 팬 매출 변화”를 물으면 위치 개념, 기간, 거래 테이블 관계를 이해해 SQL을 만들어 돌리고, 이미지·음성까지 요약해 결과 테이블에 합쳐줘요.


시장 맥락: 왜 어려운 문제인가

기업 데이터는 여러 시스템에 흩어져 있고 권한이 제각각이에요. 여기에 AI를 붙이면, 보안 경계 밖으로 데이터가 나가지 않아야 하고, 용어가 달라도 같은 뜻을 알아듣고, 근거를 확인할 수 있어야 해요. 그 셋을 동시에 만족시키면서 지연을 낮추는 게 어렵죠.

기존 플레이어들의 실패 원인:

서비스실패 포인트이 서비스의 해결책
Databricks AI/유니티 카탈로그강력하지만 멀티엔진·오픈 포맷을 쓰면 권한·카탈로그 동기화가 복잡해 설정 비용이 큼Horizon Catalog가 Apache Polaris와 완전 통합, Iceberg 테이블을 여러 엔진에서 같은 정책으로 접근
AWS Glue + Bedrock 조합기능 조립은 가능하지만 계정·리전·서비스 경계 때문에 데이터 이동·권한 전파가 번거로움제로카피 통합과 컨테이너 서비스로 데이터 옮기지 않고 앱을 데이터 쪽으로 붙임, CMK와 자동 재키로 보안 일관성

Snowflake는 “데이터를 빼지 말고 앱을 안으로 들여라”를 밀어요. SAP와의 양방향 제로카피, Vercel Vzero의 원클릭 배포, Managed MCP로 외부 도구를 안전하게 연결해, 보안 경계 안에서 에이전트가 일하게 만들었죠.


Snowflake Intelligence의 차별화 전략

보안 경계 안에서 전 과정 자동화와 검증을 결합한다

엔터프라이즈는 규정과 감사를 우선해요. Snowflake는 권한·계보·태깅 같은 거버넌스를 카탈로그에 내장하고, 시맨틱 뷰·검증 쿼리·출처 표기로 신뢰를 확보했어요. 반대로 속도만 추구하는 설계는 초기에 편하지만, 정확성 이슈로 현업이 외면하거든요.

사용자 경험은 이렇게 달라요:

  • 근거가 보인다 - 생성된 SQL, 참조 테이블, 문서 출처를 함께 제시해 재현과 재검증이 쉬움
  • 데이터가 한곳에 있다 - SAP, Postgres, Iceberg 레이크까지 카탈로그로 묶어 같은 권한 정책 적용
  • 개발이 가볍다 - VS Code·CLI·Workspaces·Spark Connect를 그대로 쓰면서 Snowflake 벡터 엔진에서 실행

성장 엔진 분석

기술 구현

데이터는 Horizon Catalog로 등록되고, 시맨틱 뷰가 비즈니스 용어와 테이블 관계를 정의해요. 비정형 데이터는 Cortex Search가 임베딩을 만들어 벡터 검색하고, 질의는 AISQL이 SQL·파이썬으로 변환해 웨어하우스에서 실행해요.

  • 데이터 수집: OpenFlow로 구조·비구조·멀티모달을 관리형 인게스트, SAP BDC Connect로 제로카피 연동, PG Lake로 Postgres에서 Iceberg 읽기·쓰기
  • 핵심 기술: Apache Polaris·Iceberg REST 카탈로그, PG Vector·PostGIS, Spark Connect, Managed MCP, Cortex REST API, Optima의 자동 최적화
  • 기술적 해자: 데이터·컴퓨트·거버넌스가 한 경계 안에 있고, 시맨틱·검증 레이어가 카탈로그에 일체화되어 있음. 데이터 중력과 보안 설계가 복제 불가능에 가까움

마케팅 퍼널

단계이 서비스의 전략
획득World Tour·BUILD 컨퍼런스, 80개 이상 파트너 런치, 개발자 에코시스템·SV AI Hub
활성화자연어 질문이 고품질 SQL로 바뀌고, 출처·검증 쿼리까지 보이는 첫 체감
리텐션Workspaces·Git 통합으로 팀 개발 흐름 편입, Optima로 비용·성능 자동 개선, 무중단 가용성
수익화사용량 기반 컴퓨트 과금, 프리미엄 기능과 컨테이너 서비스, Postgres 인스턴스 티어
추천파트너 솔루션 카탈로그, 내부 챔피언을 통한 부서 확장, 에이전트 공유로 조직 내 확산

성장 전략 요약

온보딩은 일부러 손이 많이 가요. 시맨틱 뷰 정의와 검증 쿼리 셋업을 거치게 해서, 끝까지 세팅한 팀만 쓰게 만들고 대신 정확도를 높여 유료 전환율을 지키는 전략이에요. 데이터·거버넌스를 중심으로 락인을 만들고, 파트너·오픈 포맷을 통해 폐쇄성에 대한 반발을 줄여요.


핵심 인사이트: “AI 전략은 데이터 전략”을 제품 기능으로 강제한다

Fanatics 사례처럼 속성을 고르고, 동의어를 정의하고, 검증 쿼리를 반복 튜닝한 끝에 정확도 95~100%에 도달했어요. 이 과정은 노가다처럼 보이지만, Snowflake는 시맨틱 뷰·검증 쿼리·출처 표기를 통해 이 노력을 플랫폼 단계에서 표준화했죠. 결과적으로 “빠른 답”보다 “검증 가능한 답”을 기본값으로 만들었습니다.

왜 중요하냐면요. 기업에서 한 번 신뢰를 잃은 AI는 쓰지 않아요. 반대로 근거가 보이고 재현이 되면, 법무·재무 같은 보수적 팀까지 확산됩니다. 이때부터 데이터는 더 모이고, 에이전트는 더 똑똑해져요.

팁은 간단해요. 어떤 도메인이든 용어사전과 검증 쿼리를 먼저 만들고, 그 위에 질문·응답을 올리면 정확도와 도입 속도가 동시에 올라갑니다.


비즈니스 기회: Snowflake용 시맨틱·검증 팩토리

왜 이 기회인가요?

영상에서도 정확도 95~100%에 도달하려면 속성 선정, 동의어 정의, 검증 쿼리 튜닝이 반복된다고 했어요. 많은 기업이 여기서 막혀 PoC만 하다 접습니다. 시맨틱 모델과 검증 쿼리를 빠르게 산업별 표준으로 찍어내 주는 서비스가 필요해요.

보수적으로 잡아도 중대형 Snowflake 고객 수천 곳 가운데 상위 10%만 공략해도 수백 개의 초기 타깃이 나옵니다. 부서 단위 예산으로도 결제 가능한 문제라 침투가 쉬워요.

제품 컨셉

“Semantic Works” - 시맨틱 뷰·검증 쿼리·출처 표기를 2주에 실전 수준으로 세팅

  1. 도메인 온톨로지 부트스트랩: 테이블 스키마와 dbt 메타에서 비즈니스 용어 후보를 자동 추출하고 동의어 사전을 제안
  2. 검증 쿼리 생성·평가: 주요 질문 템플릿에서 SQL 후보와 테스트 케이스를 생성, 실제 데이터로 정확도·지연·비용을 측정해 채점보드 제공
  3. 운영 가드레일: 생성된 SQL diff 감시, 권한 누락·조인 실수·비용 폭주를 사전 차단하고, 출처 표기 기준을 자동 삽입

실행 계획 (2주)

주차할 일
1주차Snowflake 계정 연결·카탈로그 수집, 상위 20개 비즈니스 질문 정의, 시맨틱 후보·동의어 자동 추출, 검증 데이터셋 샘플링, 초기 검증 쿼리 생성
2주차정확도·지연·비용 벤치마킹, 수작업 튜닝 2회 반복, 출처 표기·권한 정책 점검, Cortex Search 인덱스 생성, 대시보드·운영 가드레일 설치·이관

필요한 도구

  • Snowflake Workspaces·Cortex REST·AISQL - 시맨틱 뷰·검증 쿼리 생성·실행 - 사용량 과금
  • dbt Core/Cloud - 모델·메타데이터 연동 - 월 0~100달러 수준
  • 평가 LLM API - 용어 추출·SQL 보조·요약 - 월 100~1,000달러 예산

수익 모델

  • 프로젝트 패키지: 2주 고정가 2만~5만 달러
  • 운영 구독: 월 5천~2만 달러, 가드레일·정확도 모니터링·분기별 튜닝

초기 10개 고객이면 월 5만~20만 달러 수익이 가능합니다.

주의할 점

  • 보안·데이터 주권 이슈 → 고객 계정 내에서 실행하고, 데이터는 이동하지 않으며, 모든 산출물은 고객 카탈로그에 저장
  • 정확도 과장 리스크 → 질문·정답·채점 기준을 계약서에 명시하고, 정확도·지연·비용을 함께 보고하는 SLO 제시

이번 주 액션

고객 1곳의 “상위 20개 질문” 수집 템플릿 만들기 (30분)

시맨틱 모델 튜닝은 결국 질문 선정이 반이에요. 바로 쓸 수 있는 질문 템플릿을 만들어 다음 미팅에서 받아내세요.

👉 구글 문서로 복사해 시작: “부서별 상위 20 질문” 템플릿 만들기 → 항목: 질문, 사용 테이블, 정답 정의, 허용 오차, 민감도, 빈도, 담당자


피드백: newsletter@1am-ai.com

매일 새벽 1시, AI 트렌드를 놓치지 마세요!

이런 유용한 AI 요약을 매일 이메일로 받아보세요