코난쌤 블로그
Search
검색
다크 모드
라이트 모드
탐색기
홈
전체 글
카테고리
소개
연락처
개인정보처리방침
태그: agent-benchmark
2건의 항목
2026년 5월 24일
π-Bench — 개인 비서 에이전트가 먼저 알아서 챙기는 능력을 어떻게 평가하나
pi-bench
agent-benchmark
proactive-assistant
llm-evaluation
2026년 5월 24일
TerminalWorld — 터미널 작업 80,870개 기록에서 에이전트 벤치마크를 만들다
terminalworld
agent-benchmark
terminal
cli-agents