TL;DR
- 체감 지연의 80%는 모델 토큰 속도 + 순차 bash + SSH 재시도 + 스킬 로딩 4축에 집중.
- 현실적 상한 ~9× (3×·2×·1.5× 복합) — 100×는 토큰 생성 물리 한계로 불가능.
- 가장 큰 단일 레버: 정형 작업은 Haiku 4.5 라우팅 (단독 2–4×).
병목 분해 — 실 로그 기반
| # | 병목 | 빈도 | 1턴 손실 | 대표 사례 (이 세션) |
|---|---|---|---|---|
| 1 | Opus 4.7 1M 토큰 속도 | 매 턴 | 10–60s | 모든 응답·thinking |
| 2 | 순차 bash (parallel 미사용) | 매우 빈번 | 3–15s/콜 | psql 찾기, find/grep 5번 분할 |
| 3 | SSH 인증 실패 재시도 | 1세션 6회 | 30–90s | Too many authentication failures 루프 (alpha 5회) |
| 4 | 스킬 로딩 오버헤드 | 7+회 | 2–5s/skill | beta-db · worktree-pr · infisical · gmail · grinda-slack 반복 로드 |
| 5 | 컨텍스트 비대화 | 누적 | 턴마다 점증 | 1M 컨텍스트 — cache miss 시 비용·지연 폭증 |
| 6 | prompt cache miss | 자주 | +5–15s | 파일 수정·브랜치 스위치·5분+ idle |
| 7 | Exploration 분산 grep/find | 매 작업 | 10–30s | "import 찾기" → 3–5번 분할 호출 |
| 8 | AskUserQuestion 라운드트립 | 작업당 1–3 | 30–120s | 사용자 응답 대기 |
| 9 | Worktree setup 재시도 | 1세션 2회 | 30s+ | 첫 시도 path 오류 후 재실행 |
| 10 | 무거운 CI/typecheck | PR마다 | 1–3분 | bun type-check · alpha-e2e |
100× 분석 — 결론 / 레버 분해
모델 토큰 생성 자체가 Anthropic 인프라에 종속이라 100×는 물리적으로 불가능. 복합 적용 시 상한:
| 레버 | 효과 | 실현성 | 비고 |
|---|---|---|---|
| 모델 다운시프트 (Sonnet 4.6·Haiku 4.5 라우팅) | 2–4× | 高 | 정형 bash·grep·SSH 진단은 Haiku로 충분 |
| bash 병렬 강제 (단일 메시지 다중 tool_use) | 1.5–3× | 高 | CLAUDE.md에 명시됐지만 실행 누락 多 |
| prompt cache 유지 (sleep<270s / >1200s) | 1.3–2× | 中 | 5분 어정쩡 sleep 금지 |
| SSH config 한 번 정리 (IdentitiesOnly·키 통일) | 1.2× | 高 | 이번 세션에서 이미 해결 — 재발 방지 |
| 세션 부트 스크립트 (psql alias·ssh-prep·tunnel up) | 1.5× | 高 | 매 세션 환경 부트 ~2분 절감 |
| 스킬 호출 최소화 (아는 동작은 bash 직접) | 1.2× | 中 | beta-db → psql 한 줄로 대체 가능 |
컨텍스트 컷오프 (작업 단위 /clear) | 1.3× | 高 | 이미 사용 중 — 더 적극적으로 |
| Exploration 1회 통합 grep | 1.5× | 高 | grep -rE 'A|B|C' --include=*.ts 한 번에 |
CI 비동기 분리 (--auto 활용) | 1.5× | 中 | typecheck 3분 동안 메인 차단 X |
| 반복 패턴 매크로화 (체리픽·docs 정리 1-cmd) | 2× | 中 | 이번 세션 docs cleanup이 좋은 후보 |
복합 상한: 모델(3×) × 병렬(2×) × 캐시(1.5×) ≈ ~9×. LLM tokens/s 자체는 못 바꿈.
즉시 적용 권장 Top 5
- 단순 작업은 Haiku 4.5 —
/model haiku, grep·SSH·psql·git status 모두 Haiku로 - 단일 메시지 다중 bash 강제 — "3개 이상 정보 필요" 시 한 메시지로 묶기 (CLAUDE.md 위반 多)
- 세션 부트 스크립트 —
~/.bin/rinda-up: tunnel up + ssh-add + Infisical login 한 줄 - 5분 룰 회피 — idle 시 270초 또는 1200초+, 어정쩡한 5분은 캐시만 날림
- PR
--auto --squash디폴트 — main 정책 우회 admin 머지보다 자동 대기가 안전·전체적으로 빠름
이번 세션에서 실제로 손해본 시간 (추정)
| 구간 | 손실 추정 | 회피 방법 |
|---|---|---|
| SSH 키 교체 trial & error (alpha 5회 시도) | ~4분 | config IdentitiesOnly yes 미리 적용 |
| psql 경로 탐색 | ~30s | alias psql=/opt/homebrew/opt/libpq/bin/psql |
| Infisical 폴더 잘못된 경로 (Rinda 전체 → 어디살지 폴더) | ~2분 | 프로젝트별 .infisical.json init |
| worktree setup path 오류 후 재시도 | ~30s | 스킬 path 검증 보강 |
| biome auto-fix가 무관 테스트 파일 깨뜨림 → revert | ~2분 | scope된 lint만 |
| typecheck 3분 블로킹 | ~3분 | 백그라운드 + 다른 작업 병행 |
| 합계 | ~12분 | — |