![]()
Murmur가 뭔가요
Murmur는 Apple Silicon Mac에서 로컬로 돌아가는 실시간 음성 전사·번역 앱입니다.
마이크나 시스템 오디오를 실시간으로 받아서 텍스트로 변환하고, 필요하면 번역까지 한 화면에 보여줍니다. 서버로 데이터를 보내지 않으니 네트워크 연결 없이도 작동하고, 녹음 내용이 외부로 유출될 걱정도 없습니다.
왜 Murmur가 필요한가
실시간 STT 서비스은 이미 많습니다. Google, OpenAI, Naver 모두 훌륭한 음성 인식 API를 제공하죠. 그런데 실제로 써보면 몇 가지 걸리는 점이 있습니다.
첫째, 프라이버시입니다. 회의 내용, 의료 상담, 개인 대화 같은 민감한 음성을 외부 서버로 보내는 건 항상 찝찝합니다.
둘째, 오프라인입니다. 강의장이나 비행기처럼 네트워크가 불안정한 환경에서는 클라우드 STT가 무용지물입니다.
셋째, 비용입니다. API 기반 서비스는 사용량에 따라 요금이 계속 나옵니다. 개인이 가볍게 쓰기엔 부담스러울 수 있습니다.
Murmur는 이 세 가지 문제를 한 번에 해결합니다. Apple Silicon의 Neural Engine과 GPU를 활용해 모든 처리를 로컬에서 수행하니까요.
핵심 기능
실시간 전사
whisper-small-mlx 모델로 3초 단위 실시간 전사를 수행합니다. MLX 프레임워크 덕분에 Apple Silicon에서 최적화된 성능을 보여줍니다.
- 한국어, 영어, 일본어, 중국어 등 다국어 자동 감지
- WebRTC VAD(Voice Activity Detection)로 말소리 구간만 정확히 캡처
- 환각(hallucination) 필터와 중복 제거로 깔끔한 결과물
도메인 힌트
“의료”, “법률”, “IT” 같은 분야별 프리셋을 제공해서 고유명사와 전문 용어 인식률을 높입니다. 강의를 녹음할 때와 회의를 녹음할 때 각각 다른 힌트를 주면 훨씬 정확한 전사가 나옵니다.
오프라인 번역
NLLB-200(NLLB-200-distilled-600M) 모델로 실시간 번역을 제공합니다. 전사된 원본 텍스트와 번역이 같은 화면에 나뉘어 표시되어 원문과 번역을 동시에 확인할 수 있습니다.
서버 통신 없이 전부 로컬에서 처리되니, 해외 출장 중이나 네트워크가 끊긴 환경에서도 번역이 가능합니다.
시스템 오디오 캡처
BlackHole을 통해 YouTube 영상이나 온라인 강의의 오디오를 직접 캡처할 수 있습니다. 마이크로 스피커 소리를 다시 녹음할 필요 없이, 시스템 오디오를 곧바로 전사합니다.
파일 저장
전사 결과를 마크다운 형식으로 저장합니다. 원본 텍스트와 번역이 함께 저장되어 나중에 쉽게 찾아볼 수 있습니다.
아키텍처
Murmur는 SwiftUI 앱과 Python 코어 엔진의 이중 구조로 되어 있습니다.
SwiftUI Mac App (UI, 오디오 제어, 설정)
↕ stdin/stdout JSON-lines
Python Core Engine (STT, VAD, 번역, 후처리)
SwiftUI가 사용자 인터페이스와 오디오 입력을 담당하고, Python이 음성 처리 파이프라인을 맡습니다. 두 프로세스는 JSON-lines 프로토콜로 통신합니다.
이 구조의 장점은:
- Python 생태계 활용 — whisper-mlx, NLLB, WebRTC VAD 등 검증된 라이브러리를 그대로 사용
- SwiftUI의 네이티브 경험 — Mac 앱다운 UI와 시스템 통합
- 독립적 발전 — 코어 엔진과 UI를 각각 업데이트 가능
누구에게 유용한가
- 강의·세미나 참석자 — 실시간 전사로 강의 내용을 텍스트로 기록
- 외국어 학습자 — 원문과 번역을 동시에 보며 학습
- 회의 기록 담당자 — 오프라인에서도 실시간 회의록 작성
- 콘텐츠 크리에이터 — YouTube 영상의 자막 추출
- 프라이버시가 중요한 환경 — 의료, 법률, 금융 등 민감 정보 처리
설치와 실행
한 줄이면 됩니다.
curl -fsSL https://raw.githubusercontent.com/jkf87/murmur/master/install.sh | shGit 클론, 의존성 설치, 테스트, 빌드, /Applications/Murmur.app 설치까지 자동으로 진행됩니다.
직접 빌드하려면:
git clone https://github.com/jkf87/murmur.git
cd murmur
make allMurmur의 장점을 한눈에
| 항목 | Murmur | 클라우드 STT 서비스 |
|---|---|---|
| 프라이버시 | 전 로컬 처리 | 서버로 데이터 전송 |
| 오프라인 | 완전 지원 | 불가 |
| 비용 | 무료 (전기료만) | 사용량 과금 |
| 지연 | 로컬 추론 (~3초) | 네트워크 + API 지연 |
| 다국어 | 자동 감지 + 번역 | 서비스마다 상이 |
| 설치 | 원클릭 스크립트 | 계정 가입 + API 키 |
앞으로
Murmur는 아직 초기 단계입니다. 기본적인 실시간 전사와 번역은 안정적으로 작동하지만, 더 많은 환경에서 테스트가 필요하고 개선할 부분도 많습니다.
앞으로 추가하고 싶은 것들:
- 더 다양한 STT 모델 지원 (large 모델 옵션 등)
- 번역 품질 향상 (더 큰 NLLB 모델 또는 대안 모델)
- 글로벌 단축키로 녹음 시작/중지
- 자동 언어 전환 감지
Murmur를 써보시고 생각나는 게 있다면 편하게 이야기해주세요. 버그 리포트도 좋고, “이런 기능 있으면 좋겠다”는 제안도 좋습니다.
👉 GitHub: jkf87/murmur
이 글에 대해 궁금한 점이나 피드백이 있다면 아래에 댓글 남겨주세요. 여러분의 의견이 Murmur를 더 나은 도구로 만듭니다.