코난쌤 블로그

홈전체 글카테고리소개연락처개인정보처리방침

태그: benchmark

5건의 항목

  • 2026년 6월 03일

    공간 기반 모델 41개 싹 다 테스트해봤습니다 — SpatialBench가 밝혀낸 충격적 현실

    • spatial-intelligence
    • 3d-reconstruction
    • benchmark
    • computer-vision
    • robotics
  • 2026년 5월 29일

    MemTrace: LLM 메모리 시스템의 에러를 추적하고 원인을 규명하는 방법

    • ai
    • llm
    • agent
    • memory
    • debugging
    • benchmark
    • paper-review
  • 2026년 4월 24일

    DeepSeek-V4-Pro / Flash 공개 정리: 100만 토큰 컨텍스트와 벤치마크 결과

    • ai
    • deepseek
    • huggingface
    • llm
    • moe
    • long-context
    • reasoning
    • benchmark
    • open-source
  • 2026년 3월 31일

    Agentic Evaluations Workshop 핵심 정리 — 에이전트 평가의 다음 과제

    • ai
    • agent
    • evals
    • hugging-face
    • benchmark
  • 2026년 3월 30일

    FinMCP-Bench: MCP 기반 금융 에이전트 벤치마크가 중요한 이유

    • ai
    • llm
    • agent
    • mcp
    • benchmark
    • finance
    • quartz

Created with Quartz v4.5.2 © 2026

  • 소개
  • 연락처
  • 개인정보처리방침
  • 전체 글