새벽 1시의 AI

아카이브로 돌아가기

AI 뉴스레터 - 2025-12-21 (일)

2025년 12월 21일약 11분7개 영상0회 조회

오늘의 요약

2025-12-21 딥다이브: How I code with AI right now

상세 내용

🌙 새벽 1시의 AI - 2025-12-21 (일)

이번 주 딥다이브 | 📖 읽기 약 8분

📺 이번 주 영상

지금 내가 AI와 함께 코딩하는 방법

지금 내가 AI와 함께 코딩하는 방법

지금 내가 AI와 함께 코딩하는 방법

📺 채널: Theo - t3․gg
👀 조회수: 130,719
🔗 영상 보기

🎬 이번 주 딥다이브

📺 영상 정보

제목: How I code with AI right now
채널: Theo - t3․gg
길이: 알 수 없음

📖 영상 내용 (Case Study 구조 적용)

🎯 Hook: 왜 이 영상인가?

놀랍게도, 그는 에디터(Cursor) 하나로 기획·코딩·리뷰·워크트리·Git PR까지 AI 에이전트를 완전 통합해, 코드 품질과 속도를 동시에 끌어올립니다. 무려 68시간 걸리던 전체 벤치마크 대신, “드라이런+도구호출 검증+타입체크”로 피드백 루프를 분 단위로 줄여 신뢰성을 대폭 개선했습니다. 단 몇 번의 재시도(머지당 45회)로 프로덕션에 안전하게 반영하는, 실전형 AI 개발 워크플로우를 공개합니다.

📍 배경

어떻게 가능했을까요? 배경을 살펴보면, 2023년 Copilot 이후 코딩 방식이 바뀌었고, 지금은 Cursor의 에이전트 모드와 Bun 기반 TypeScript CLI를 중심으로 OpenRouter+Vercel AI SDK를 묶어 사용합니다. 이 방법은 “이미 코딩 가능한 개발자”를 위한 실무 워크플로우이며, LLM 엔드포인트는 요청당 비용이 커 악성 트래픽에 취약하므로 토큰버킷 레이트리밋·테스트·코드리뷰로 신뢰성을 확보합니다. 투자 편향 가능성을 언급하며 도구 평가의 투명성도 강조합니다.

🔄 핵심 내용

구체적인 과정은, Bun 기반 TypeScript CLI로 “에세이 생성→리뷰→수정” 파이프라인을 만들고 결과를 타임스탬프 마크다운으로 저장합니다. 모델 라우팅은 OpenRouter와 Vercel AI SDK를 연결(OPENROUTER_API_KEY)하고, 모델 ID를 하드코딩해 타입 안전성을 유지합니다. 기획은 Opus나 GPT‑5.1(선호), 구현·반복은 저비용 Composer를 쓰며, 필요 시 Sonnet·Gemini 3 Pro 등 다중 모델을 병렬 비교합니다. Cursor는 bun을 자동 감지해 node/pnpm 대신 bun을 지시하고, 워크트리로 작업을 분리해 셋업 스크립트가 파일과 .env를 복사합니다. 레이트리밋은 TypeScript 코드로 rules 배열에 토큰버킷(refill rate, interval, capacity) 정의, 사용자 ID를 AJ.protect에 전달해 모델별 비용 가중 토큰 소모를 제어합니다. 신뢰성은 긴 벤치마크(6~8시간)를 버리고, 드라이런(bun run dryrun)으로 툴호출 파라미터·출력 포함 여부를 검증하고, tsc 엄격모드·any 금지로 타입 안정성을 강화합니다. 문자열·마크다운 포맷은 여전히 난점이라 dent 같은 포맷터 도입을 검토합니다. GitHub 워크플로우는 GH CLI의 번거로움을 피하려 LazyGit으로 PR을 열고, PR에는 Grapile/Code Rabbit 등 AI 리뷰를 붙여 “tool 결과 키 오타” 같은 미묘한 버그까지 잡습니다. 마지막으로, “스마트 모델로 계획→덤 모델로 구현→오류 반영”의 루프를 고수하고, 프롬프트보다 테스트/체크 하네스로 모델을 제어하라고 조언합니다.

💎 핵심 인사이트

이 사례에서 배울 점은...

인사이트 1: 고비용 모델은 “계획”, 저비용 모델은 “구현/반복”에 배치하는 하이브리드 전략이 비용과 품질을 동시에 최적화한다.
인사이트 2: 프롬프트 장난보다 “드라이런·도구호출 검증·타입체크” 하네스를 넣는 것이 신뢰성을 가장 빨리 끌어올린다.
인사이트 3: 레이트리밋(토큰버킷)과 사용자·모델별 비용 가중 제어는 LLM 제품을 악성 트래픽과 예산 초과에서 지켜주는 필수 방어선이다.

🔧 실행 가이드

바로 적용할 수 있는 것들

에이전트 파이프라인 템플릿화: Bun TypeScript CLI에서 generate→review→revise 3단계를 함수로 분리하고 결과를 runs/에 타임스탬프 저장.
비용-신뢰성 하네스 추가: bun run dryrun 스크립트로 출력 포함·툴호출 파라미터 검증, bun run tsc로 타입 체크를 CI에 넣기.
레이트리밋 게이트: AJ.protect 스타일의 TS 기반 토큰버킷 rules(refill rate/interval/capacity)와 사용자 ID 연동으로 모델별 토큰 소모량 제어.

필요한 도구/리소스

Cursor(에디터/에이전트), Bun, TypeScript, OpenRouter + Vercel AI SDK
Git worktree, LazyGit, Grapile/Code Rabbit(PRS AI 리뷰)

⚠️ 주의할 점

긴 벤치마크는 피드백 루프를 망친다: 짧은 드라이런·단위 테스트를 우선.
문자열/마크다운 포맷은 모델에 과신 금지: 전용 포맷터/유효성 검사기를 별도 두기.

🧭 비즈니스 기회 (BAB 구조 적용)

💡 기회 1: “LLM 코스트-레이트리밋 게이트웨이 for TypeScript” (쉬움 - 1주 내 시작)

Before (현재 상황): 예전에는 LLM 엔드포인트가 요청당 비용이 커 악성 트래픽·오용에 취약했고, YAML/대시보드 중심 설정은 형상관리·테스트가 어려웠습니다.

After (변화 후): 그런데 이 솔루션을 적용하면 TS 코드 한 파일로 사용자별·모델별 토큰버킷을 선언하고, 비용 가중·모델 라우팅을 타입 안전하게 관리합니다. PR에서 정책 리뷰·테스트가 가능해집니다.

Bridge (전환 방법): 어떻게 가능할까요? 비결은 TS SDK 형태의 게이트웨이 라이브러리입니다.

rules 배열로 refill rate/interval/capacity 정의
사용자 ID/모델별 가중치로 토큰 차감
OpenRouter/AISDK 미들웨어와 로깅·경보 연동

1주 시작 플랜:

Day 1-2: 최소 SDK(Express/Bun 서버 미들웨어)와 토큰버킷 구현
Day 3-4: OpenRouter 프록시, per-model weight, 테스트 추가
Day 5-7: 예제 레포·문서·npm 배포(OSS) + 스타터 템플릿

필요 도구: Bun/Node, TypeScript, OpenRouter, Vercel AI SDK, Redis(옵션)

수익 모델: 오픈소스 코어 + Pro(대시보드/알림/SLA), 팀 라이선스

⭐ 쉬움 | 💰 시간만 투자 | 📈 팀당 월 수백~수천 달러 비용 절감 및 사고 방지

🚀 기회 2: “Agentic Worktree Orchestrator” (중간 - 1-2달 개발)

Before: 현재 모델 실험·플랜 파일·.env 복사·runs 관리가 수동이며, GH CLI/PR 흐름도 비효율적입니다.

After: 워크트리 생성부터 .cursor 플랜 주입, runs 디렉터리 관리, 다중 모델 병렬 비교, LazyGit/PR-리뷰 자동화까지 원클릭 오케스트레이션이 됩니다.

Bridge: 비결은 Cursor·Git worktree·OpenRouter를 감싼 CLI입니다.

worktree 생성+env 복사+bun install 자동
generate→review→revise 파이프라인 템플릿
다중 모델 A/B/C 실행, 결과 리포트·비용 집계

시작 플랜:

주1: CLI 스캐폴딩, worktree/env/runs 자동화
주2-3: 모델 병렬 실행·리포트·비용 추적
주4-6: LazyGit/PR 생성·AI 리뷰(Grapile) 훅, 문서/예제

필요 도구: Bun, TypeScript, Git, OpenRouter, Grapile API

수익 모델: CLI 무료 + 팀용 Cloud(로그/비용 대시보드), 좌석 과금

⭐⭐ 중간 | 💰 1~~2인개월 | 📈 실험 속도 3~~5배, 모델비 20~40% 절감

🏆 기회 3: “AI Dev Reliability Platform” (어려움 - 장기 프로젝트)

Before: 모델은 종종 빈 출력·포맷 붕괴·툴호출 파라미터 오류를 냅니다. 긴 벤치마크는 피드백이 늦고, 신뢰도 지표/가시성이 부족합니다.

After: 드라이런·도구호출 검증·타입체크·미니앱 실행까지 표준 하네스를 SaaS로 제공, PR에 신뢰도 점수와 회귀 리포트를 붙입니다.

Bridge: 전환 방법은 “검증 가능한 플랜+하네스”를 서비스화하는 것입니다.

프롬프트 대신 테스트 가능한 플랜/시나리오 러너
결과/파라미터 유효성 검사, 마크다운 포맷 체커
GH PR 봇: diff별 회귀/비용/성능 메트릭 코멘트

시작 플랜:

0-3개월: 코어 러너/체커, GitHub 앱, 기본 대시보드
3-6개월: 시나리오 마켓플레이스, 모델 코스트 옵티마이저
6-12개월: 기업 SSO, 정책/감사 로그, SLA

필요 도구: TS/Node, Postgres, Redis/ClickHouse, GitHub App, OpenRouter

수익 모델: 시트/워크스페이스 과금 + 사용량 기반(시나리오/분석)

⭐⭐⭐ 어려움 | 💰 6~12개월 | 📈 배포 안정성↑, 롤백/장애 비용↓, 대규모 팀 채택 가능

✅ 이번 주 액션

오늘 당장 시작할 수 있는 3가지:

generate→review→revise 3단계 스크립트 작성 후 runs/에 타임스탬프 저장을 자동화하세요. (⏱️ 45분)
bun run dryrun와 bun run tsc를 CI에 추가하고, 도구호출 파라미터 검증을 테스트로 넣으세요. (⏱️ 30분)
OpenRouter 프록시에 토큰버킷 레이트리밋(rules: refill/interval/capacity)과 모델별 가중치를 적용하세요. (⏱️ 60분)

📺 원본 영상: [영상 링크]

📬 피드백

이 뉴스레터가 도움이 되셨나요? 피드백을 보내주세요!

💬 피드백 보내기
🌐 웹사이트 방문

이 뉴스레터는 AI를 활용하여 생성되었습니다. © 2025 새벽 1시의 AI. All rights reserved.

매일 새벽 1시, AI 트렌드를 놓치지 마세요!

이런 유용한 AI 요약을 매일 이메일로 받아보세요