코난쌤 블로그
Search
검색
다크 모드
라이트 모드
탐색기
홈
전체 글
카테고리
소개
연락처
개인정보처리방침
태그: llm-evaluation
1건의 항목
2026년 5월 24일
π-Bench — 개인 비서 에이전트가 먼저 알아서 챙기는 능력을 어떻게 평가하나
pi-bench
agent-benchmark
proactive-assistant
llm-evaluation