NeMo Speaker Diarization

A complete speaker diarization pipeline using NVIDIA NeMo (via WSL2) with Whisper transcription.

Features

Speaker Diarization: Identify "who spoke when" in audio files
Transcription: Optional Whisper-based transcription with speaker labels
Dual Backend:
- WSL2 + NeMo for advanced diarization (Linux)
- pyannote.audio fallback for Windows
Custom Whisper Models: Support for cached/finetuned models
Multi-language: Support for English, Persian, Arabic, and more

Quick Start

from nemo_diarization import diarize_and_transcribe

result = diarize_and_transcribe(
    meeting_audio_path="meeting.wav",
    expected_language="en",
    output_transcriptions=True,
    transcriptor_model_path=None  # or path to your Whisper model
)

print(f"Speakers: {result['num_speakers']}")
print(f"Transcription: {result['transcription']}")

Installation

Windows

pip install -r requirements_windows.txt

WSL2 (for NeMo)

wsl -d Ubuntu bash -c "cd /mnt/d/Git_repos/Nemo-diarization/venv_nemo_wsl && bin/pip install -r /mnt/d/Git_repos/Nemo-diarization/requirements_wsl2.txt"

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
outputs/db		outputs/db
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
example_usage.py		example_usage.py
nemo_diarization.py		nemo_diarization.py
nemo_diarization_wsl.py		nemo_diarization_wsl.py
requirements_windows.txt		requirements_windows.txt
requirements_wsl2.txt		requirements_wsl2.txt
test_nemo_diarization.ipynb		test_nemo_diarization.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NeMo Speaker Diarization

Features

Quick Start

Installation

Windows

WSL2 (for NeMo)

About

Uh oh!

Releases

Packages

Languages

FarshadAmiri/Nemo-diarization

Folders and files

Latest commit

History

Repository files navigation

NeMo Speaker Diarization

Features

Quick Start

Installation

Windows

WSL2 (for NeMo)

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages