코난쌤 블로그

태그: benchmark

2건의 항목

  • 2026년 3월 31일

    Agentic Evaluations Workshop 핵심 정리 — 에이전트 평가의 다음 과제

    • ai
    • agent
    • evals
    • hugging-face
    • benchmark
  • 2026년 3월 30일

    FinMCP-Bench: MCP 기반 금융 에이전트 벤치마크가 중요한 이유

    • ai
    • llm
    • agent
    • mcp
    • benchmark
    • finance
    • quartz

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community