Murmur — Apple Silicon에서 돌아가는 실시간 음성 전사·번역 앱

Murmur가 뭔가요

Murmur는 Apple Silicon Mac에서 로컬로 돌아가는 실시간 음성 전사·번역 앱입니다.

마이크나 시스템 오디오를 실시간으로 받아서 텍스트로 변환하고, 필요하면 번역까지 한 화면에 보여줍니다. 서버로 데이터를 보내지 않으니 네트워크 연결 없이도 작동하고, 녹음 내용이 외부로 유출될 걱정도 없습니다.

왜 Murmur가 필요한가

실시간 STT 서비스은 이미 많습니다. Google, OpenAI, Naver 모두 훌륭한 음성 인식 API를 제공하죠. 그런데 실제로 써보면 몇 가지 걸리는 점이 있습니다.

첫째, 프라이버시입니다. 회의 내용, 의료 상담, 개인 대화 같은 민감한 음성을 외부 서버로 보내는 건 항상 찝찝합니다.

둘째, 오프라인입니다. 강의장이나 비행기처럼 네트워크가 불안정한 환경에서는 클라우드 STT가 무용지물입니다.

셋째, 비용입니다. API 기반 서비스는 사용량에 따라 요금이 계속 나옵니다. 개인이 가볍게 쓰기엔 부담스러울 수 있습니다.

Murmur는 이 세 가지 문제를 한 번에 해결합니다. Apple Silicon의 Neural Engine과 GPU를 활용해 모든 처리를 로컬에서 수행하니까요.

핵심 기능

실시간 전사

whisper-small-mlx 모델로 3초 단위 실시간 전사를 수행합니다. MLX 프레임워크 덕분에 Apple Silicon에서 최적화된 성능을 보여줍니다.

한국어, 영어, 일본어, 중국어 등 다국어 자동 감지
WebRTC VAD(Voice Activity Detection)로 말소리 구간만 정확히 캡처
환각(hallucination) 필터와 중복 제거로 깔끔한 결과물

도메인 힌트

“의료”, “법률”, “IT” 같은 분야별 프리셋을 제공해서 고유명사와 전문 용어 인식률을 높입니다. 강의를 녹음할 때와 회의를 녹음할 때 각각 다른 힌트를 주면 훨씬 정확한 전사가 나옵니다.

오프라인 번역

NLLB-200(NLLB-200-distilled-600M) 모델로 실시간 번역을 제공합니다. 전사된 원본 텍스트와 번역이 같은 화면에 나뉘어 표시되어 원문과 번역을 동시에 확인할 수 있습니다.

서버 통신 없이 전부 로컬에서 처리되니, 해외 출장 중이나 네트워크가 끊긴 환경에서도 번역이 가능합니다.

시스템 오디오 캡처

BlackHole을 통해 YouTube 영상이나 온라인 강의의 오디오를 직접 캡처할 수 있습니다. 마이크로 스피커 소리를 다시 녹음할 필요 없이, 시스템 오디오를 곧바로 전사합니다.

파일 저장

전사 결과를 마크다운 형식으로 저장합니다. 원본 텍스트와 번역이 함께 저장되어 나중에 쉽게 찾아볼 수 있습니다.

아키텍처

Murmur는 SwiftUI 앱과 Python 코어 엔진의 이중 구조로 되어 있습니다.

SwiftUI Mac App (UI, 오디오 제어, 설정)
        ↕ stdin/stdout JSON-lines
Python Core Engine (STT, VAD, 번역, 후처리)

SwiftUI가 사용자 인터페이스와 오디오 입력을 담당하고, Python이 음성 처리 파이프라인을 맡습니다. 두 프로세스는 JSON-lines 프로토콜로 통신합니다.

이 구조의 장점은:

Python 생태계 활용 — whisper-mlx, NLLB, WebRTC VAD 등 검증된 라이브러리를 그대로 사용
SwiftUI의 네이티브 경험 — Mac 앱다운 UI와 시스템 통합
독립적 발전 — 코어 엔진과 UI를 각각 업데이트 가능

누구에게 유용한가

강의·세미나 참석자 — 실시간 전사로 강의 내용을 텍스트로 기록
외국어 학습자 — 원문과 번역을 동시에 보며 학습
회의 기록 담당자 — 오프라인에서도 실시간 회의록 작성
콘텐츠 크리에이터 — YouTube 영상의 자막 추출
프라이버시가 중요한 환경 — 의료, 법률, 금융 등 민감 정보 처리

설치와 실행

한 줄이면 됩니다.

curl -fsSL https://raw.githubusercontent.com/jkf87/murmur/master/install.sh | sh

Git 클론, 의존성 설치, 테스트, 빌드, /Applications/Murmur.app 설치까지 자동으로 진행됩니다.

직접 빌드하려면:

git clone https://github.com/jkf87/murmur.git
cd murmur
make all

Murmur의 장점을 한눈에

항목	Murmur	클라우드 STT 서비스
프라이버시	전 로컬 처리	서버로 데이터 전송
오프라인	완전 지원	불가
비용	무료 (전기료만)	사용량 과금
지연	로컬 추론 (~3초)	네트워크 + API 지연
다국어	자동 감지 + 번역	서비스마다 상이
설치	원클릭 스크립트	계정 가입 + API 키

앞으로

Murmur는 아직 초기 단계입니다. 기본적인 실시간 전사와 번역은 안정적으로 작동하지만, 더 많은 환경에서 테스트가 필요하고 개선할 부분도 많습니다.

앞으로 추가하고 싶은 것들:

더 다양한 STT 모델 지원 (large 모델 옵션 등)
번역 품질 향상 (더 큰 NLLB 모델 또는 대안 모델)
글로벌 단축키로 녹음 시작/중지
자동 언어 전환 감지

Murmur를 써보시고 생각나는 게 있다면 편하게 이야기해주세요. 버그 리포트도 좋고, “이런 기능 있으면 좋겠다”는 제안도 좋습니다.

👉 GitHub: jkf87/murmur

이 글에 대해 궁금한 점이나 피드백이 있다면 아래에 댓글 남겨주세요. 여러분의 의견이 Murmur를 더 나은 도구로 만듭니다.

코난쌤 블로그

탐색기