코난쌤 블로그
Search
검색
다크 모드
라이트 모드
탐색기
홈
전체 글
카테고리
소개
연락처
개인정보처리방침
태그: reinforcement-learning
9건의 항목
2026년 6월 03일
스마트폰을 조작하는 AI… 평가 환경이 병목이었습니다 — MobileGym 해법
mobile-agent
gui-agent
simulation
reinforcement-learning
android
2026년 5월 29일
AI가 도구를 쓰는 법을 배우지 못하는 이유, NVIDIA가 찾은 해법
AI
NVIDIA
reinforcement-learning
multimodal
agentic-reasoning
AXPO
paper-review
2026년 5월 28일
에이전트 RL 최적화: 언제 도구를 쓰고, 언제 스킬로 남길까
ai
agent
reinforcement-learning
tool-use
skills
memory
paper-review
2026년 5월 28일
모바일Gym: 모바일 GUI 에이전트를 위한 검증 가능한 초경량 시뮬레이션
ai
mobile-agent
gui-agent
simulation
reinforcement-learning
paper-review
2026년 5월 27일
에이전트 RL 3총사: 환경을 만들고, 터미널을 읽고, 리서치를 합성하는 법
ai
reinforcement-learning
agent
paper-review
rlvr
2026년 5월 27일
LLM 에이전트를 위한 RL 환경 설계: 에이전트 용어사전과 환경 분류학
ai
agent
reinforcement-learning
rl-environment
harness
glossary
2026년 5월 27일
SEAL — 에이전트가 배우면 환경도 함께 진화해야 한다
seal
llm-agent
tool-use
co-evolution
reinforcement-learning
paper-review
2026년 5월 25일
포켓몬 레드를 RL로 클리어하기 — PokeRL 아키텍처부터 실전 실행까지
reinforcement-learning
RL
game-ai
pytorch
pyboy
PPO
pokemon
paper-review
tutorial
open-source
2026년 5월 09일
SkillOS: 스트리밍 태스크에서 스스로 진화하는 에이전트를 위한 스킬 큐레이션 학습
AI
LLM
agent
reinforcement-learning
skill-learning
paper-review