Understand Anything: 코드베이스를 지식그래프로 변환하는 멀티에이전트 파이프라인

새 팀에 합류했다. 코드베이스가 20만 줄. 어디서부터 읽어야 할지 모르겠다. — 이 경험, 개발자라면 누구나 해봤을 거다.

Understand Anything — 코드베이스를 대화형 지식그래프로 변환

Understand Anything은 이 문제를 정면으로 공략함. 코드베이스 전체를 스캔해서 파일·함수·클래스·의존성을 노드로, 관계를 엣지로 하는 지식그래프를 만듦. 그래프를 대시보드에서 시각적으로 탐색할 수 있음.
Claude Code 플러그인으로 시작했지만, 지금은 Cursor, VS Code + GitHub Copilot, Codex, Gemini CLI, OpenCode, Vibe CLI, Cline, KIMI CLI 등 14개 플랫폼을 지원함. 설치 한 줄이면 됨.

핵심 설계: Tree-sitter + LLM 하이브리드

이 도구의 핵심 통찰은 “정적 분석과 LLM이 각각 잘하는 걸 나눠서 하자”는 거임.
Tree-sitter(결정론적) — 소스코드를 파싱해서 구문 트리를 만들고, import/export, 함수·클래스 정의, 호출 사이트, 상속 관계 같은 구조적 팩트를 추출함. 같은 입력 → 같은 출력. 매번 동일함. 지문(fingerprint) 기반 변경 감지도 담당.
LLM(시맨틱) — 파서가 뽑은 구조와 원본 소스를 함께 읽고, 파서가 할 수 없는 걸 함. 평이한 영어 요약, 태그, 아키텍처 레이어 배정, 비즈니스 도메인 매핑, 가이드 투어, 언어 개념 콜아웃.
이 분리 덕분에 그래프의 구조적 측면은 재현 가능(같은 코드 → 같은 엣지)하고, 시맨틱 측면은 의도를 포착함. 파일이 뭘 하는지가 아니라 뭘 위한 건지를 알려줌.

/understand 명령 하나로 5개 전문 에이전트가 순차·병렬로 돌아감.
project-scanner: 파일 발견, 언어·프레임워크 감지
file-analyzer: 함수·클래스·import 추출, 그래프 노드·엣지 생성. 최대 5개 동시 실행, 배치당 20-30파일 처리
architecture-analyzer: 아키텍처 레이어 식별 (API, Service, Data, UI, Utility)
tour-builder: 의존성 순서대로 정렬된 가이드 투어 생성
graph-reviewer: 그래프 완전성·참조 무결성 검증
/understand-domain을 실행하면 6번째 에이전트인 domain-analyzer가 추가로 돌아감. 비즈니스 도메인, 플로우, 프로세스 스텝을 추출함.
/understand-knowledge는 Karpathy 패턴 LLM 위키를 입력으로 받아서, article-analyzer가 엔티티·클레임·암묵적 관계를 추출함. 위키를 탐색 가능한 아이디어 그래프로 바꿈.

증분 업데이트: 매번 전체를 다시 분석하지 않음. 변경된 파일만 재분석. --auto-update 플래그로 post-commit 훅을 설정하면 커밋마다 그래프가 자동 갱신됨.
팀 공유: 그래프는 JSON 파일임. .understand-anything/ 디렉토리를 커밋하면 팀원들이 파이프라인을 돌리지 않아도 됨. 온보딩, PR 리뷰, docs-as-code에 활용 가능. 10MB 이상이면 git-lfs 권장.
모노레포 지원: understand src/frontend처럼 서브디렉토리만 스캔 가능.
다국어: --language ko로 노드 요약, 대시보드 UI, 가이드 투어를 한국어로 생성.

코드 이해(code understanding)는 AI 코딩 에이전트의 다음 전장임. 현재 에이전트들은 컨텍스트 윈도우 안에 파일을 때려 넣고 LLM이 이해하길 바라는 구조. 파일이 많아지면 어텐션이 흐려지고, 아키텍처 수준의 이해는 불가능에 가까움.
Understand Anything은 다른 접근을 함. 코드를 먼저 구조화된 그래프로 만들고, 에이전트(또는 사람)가 그래프를 탐색하게 함. 컨텍스트 윈도우 한계를 우회하는 방법.
SciAtlas가 논문 4,300만 편을 지식그래프로 만들어 연구 에이전트에 먹이는 거라면, Understand Anything은 코드베이스를 지식그래프로 만들어 코딩 에이전트에 먹이는 거. “지식그래프가 인지 지도가 된다”는 패턴이 반복됨.
Tree-sitter 기반 구조 분석이 결정론적이라는 게 중요함. LLM만 쓰면 같은 코드를 넣어도 매번 다른 그래프가 나옴. 구조는 확정하고, 의미만 LLM에 맡기는 설계가 신뢰성의 핵심.

참고자료