코난쌤 블로그

홈전체 글카테고리소개연락처개인정보처리방침

태그: AI-benchmark

2건의 항목

  • 2026년 6월 04일

    DarkForest: 에이전트끼리 덜 대화할수록 정답에 가까워진다

    • LLM
    • multi-agent
    • reasoning
    • paper-review
    • AI-benchmark
  • 2026년 6월 03일

    GPT-5.5도 절반밖에 못 푸는 한국어 벤치마크: K-BrowseComp

    • AI-benchmark
    • web-browsing-agent
    • korean-ai
    • agentic-evaluation
    • K-BrowseComp

Created with Quartz v4.5.2 © 2026

  • 소개
  • 연락처
  • 개인정보처리방침
  • 전체 글