코난쌤 블로그

태그: compression

1건의 항목

  • 2026년 3월 25일

    TurboQuant: LLM KV 캐시를 3비트로 압축하면서 속도까지 8배 빠르게

    • ai
    • llm
    • quantization
    • compression
    • google-research
    • kv-cache
    • vector-search
    • iclr2026

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community