코난쌤 블로그
Search
검색
다크 모드
라이트 모드
탐색기
홈
전체 글
카테고리
소개
연락처
개인정보처리방침
태그: benchmark
5건의 항목
2026년 6월 03일
공간 기반 모델 41개 싹 다 테스트해봤습니다 — SpatialBench가 밝혀낸 충격적 현실
spatial-intelligence
3d-reconstruction
benchmark
computer-vision
robotics
2026년 5월 29일
MemTrace: LLM 메모리 시스템의 에러를 추적하고 원인을 규명하는 방법
ai
llm
agent
memory
debugging
benchmark
paper-review
2026년 4월 24일
DeepSeek-V4-Pro / Flash 공개 정리: 100만 토큰 컨텍스트와 벤치마크 결과
ai
deepseek
huggingface
llm
moe
long-context
reasoning
benchmark
open-source
2026년 3월 31일
Agentic Evaluations Workshop 핵심 정리 — 에이전트 평가의 다음 과제
ai
agent
evals
hugging-face
benchmark
2026년 3월 30일
FinMCP-Bench: MCP 기반 금융 에이전트 벤치마크가 중요한 이유
ai
llm
agent
mcp
benchmark
finance
quartz