코난쌤 블로그

홈전체 글카테고리소개연락처개인정보처리방침

태그: multimodal

4건의 항목

  • 2026년 6월 09일

    NVIDIA Cosmos 3: 물리 AI를 위한 옴니모달 월드 모델

    • AI
    • NVIDIA
    • world-model
    • robotics
    • multimodal
    • open-source
  • 2026년 5월 29일

    AI가 도구를 쓰는 법을 배우지 못하는 이유, NVIDIA가 찾은 해법

    • AI
    • NVIDIA
    • reinforcement-learning
    • multimodal
    • agentic-reasoning
    • AXPO
    • paper-review
  • 2026년 5월 24일

    LatentOmni — 오디오와 비디오를 잠재 공간에서 하나로 묶는 멀티모달 추론

    • latentomni
    • multimodal
    • audio-visual
    • latent-reasoning
  • 2026년 4월 18일

    NVIDIA Nemotron OCR v2, 한국어 OCR SOTA급인가? NED 뜻, 허깅페이스 사용법, 권장 GPU 사양 정리

    • nvidia
    • ocr
    • huggingface
    • korean-ai
    • document-ai
    • multimodal
    • rag

Created with Quartz v4.5.2 © 2026

  • 소개
  • 연락처
  • 개인정보처리방침
  • 전체 글