코난쌤 블로그

태그: quantization

2건의 항목

  • 2026년 4월 10일

    TurboQuant: 16GB Mac에서 대형 LLM을 돌리는 새로운 방법

    • ai
    • llm
    • mac
    • local-ai
    • turboquant
    • quantization
  • 2026년 3월 25일

    TurboQuant: LLM KV 캐시를 3비트로 압축하면서 속도까지 8배 빠르게

    • ai
    • llm
    • quantization
    • compression
    • google-research
    • kv-cache
    • vector-search
    • iclr2026

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community