nvidia-nemo

This repository combines `WavLM`, a powerful speech representation model from Microsoft, with `MSDD` (Multi-Scale Diarization Decoder), a state-of-the-art approach for speaker diarization from Nvidia.

microsoft speech embedding speaker-diarization diarization nvidia-nemo wavlm speech-embedding

UpdatedJun 17, 2025
Jupyter Notebook

Rumeysakeskin /Question-Answering-BERT

Sponsor

Star8

Extractive Question-Answering with BERT on SQuAD v2.0 (Stanford Question Answering Dataset) using NVIDIA PyTorch Lightning

nlp search-engine chatbots squad bert pytorch-lightning nvidia-nemo extractive-question-answering

UpdatedApr 18, 2023
Jupyter Notebook

Rumeysakeskin /ASR-Quantization

Sponsor

Star8

Post-training quantization on Nvidia Nemo ASR model

pytorch speech-recognition quantization model-deployment pytorch-lightning post-training-quantization nvidia-nemo

UpdatedAug 23, 2023
Jupyter Notebook

KevinGeLe /SmartSRT

Star6

📄 SmartSRT is a command-line tool for generating accurate subtitles with per-word timestamps. It uses WhisperAI for speech transcription, NVIDIA NeMo for diarization, and OpenCV for face recognition. The program is good at creating high accuracy subtitles. 🎧💻⚙️

audio python cuda subtitles text-summarization face-recognition srt cv2 whisper transcribe timestamps nvidia-nemo

UpdatedFeb 15, 2023

denizariyan /Real-Time-Auto-Transcriber

Star4

Automatic transcriber made with the Nvidia NeMo AI toolkit. Used to transcribe speech to text in real-time from any source. Requires CUDA capable GPU to run on the local machine, if setup using virtual audio cables can transcribe the audio that is being played in real-time without any other requirements.

real-time speech-recognition subtitle speech-to-text audio-processing nvidia-cuda transcriber accesibility hearing-impaired nvidia-nemo

UpdatedOct 18, 2020
Python

JINHXu /tutorial-speaker-identification-with-nemo

Star4

The simplest & most comprehensible tutorial on speaker identification with NVIDIA's `Nemo`.

machine-learning tutorial neural-network neural-networks classification nemo speaker-recognition nvidia-cuda nvidia-gpu speaker-identification nvidia-nemo

UpdatedAug 5, 2021
Python

HROlive /Poland-End-To-End-LLM-Bootcamp

Star2

This bootcamp is designed to give NLP researchers an end-to-end overview on the fundamentals of NVIDIA NeMo framework, complete solution for building large language models. It will also have hands-on exercises complimented by tutorials, code snippets, and presentations to help researchers kick-start with NeMo LLM Service and Guardrails.

nvidia triton gpt tensorrt nvidia-nemo prompt-tuning p-tuning llm llm-training llm-inference llama2 nemo-guardrails

UpdatedMar 7, 2024
Jupyter Notebook

aaaastark /NeMo-WeightsBiases-TTS

Star1

Training and Tunning a Text to speech model with Nvidia NeMo and Weights and Biases

text-to-speech nemo weights-and-biases nvidia-nemo hifigan fastpitch

UpdatedDec 8, 2022
Jupyter Notebook

hariharan1412 /hindi-asr-app

Star1

FastAPI-based Hindi ASR app using NVIDIA NeMo + ONNX, with Docker support for easy deployment.

docker deep-learning nvidia asr-model nvidia-nemo

UpdatedMay 25, 2025
Python

ssharkov03 /ru-speech-recognition

Star1

Module for russian speech recognition using NVIDIA Nemo.

speech-recognition chunking spelling-correction asr russian-language nvidia-nemo

UpdatedFeb 12, 2023
Python

transiteration /stt_kz_quartznet15x5

Star1

Implementation of a Kazakh Speech-to-Text Model using the NVIDIA NeMo toolkit for efficient transcription of spoken Kazakh speech into text.

pytorch stt pytorch-lightning nvidia-nemo

UpdatedJan 22, 2024
Python

wheevu /nemo-vietnamese-asr

Star1

End-to-End MLOps pipeline for Vietnamese ASR using NVIDIA NeMo. Features custom ETL for YouTube data, robust data validation, and a hybrid Local-to-Cloud workflow for deploying Conformer-CTC models on GPU.

deep-learning pytorch automatic-speech-recognition speech-to-text audio-processing low-resource-languages vietnamese-asr nvidia-nemo mlops-pipeline conformer-ctc

UpdatedDec 16, 2025
Python

pietroDeAngeli /Diarization_NVIDIA_Nemo

Star0

Diarizer system that takes as input .wav files and it transcribe the audio saying who spoke and when. This has been done using the NVIDIA Nemo Framework and pre-trained models.

audio-processing speaker-identification asr-model diarization nvidia-nemo

UpdatedNov 11, 2025
Python

InfiniteHelios /nemo-audio-profanity-detector-app

Star0

Audio profanity detector desktop app developed with PyQt5 using NVidia-Nemo tech.

audio pyqt5 speech-to-text nemo profanity-detection nvidia-nemo

UpdatedDec 4, 2021
Python

shakeel-data /genai-autonomous-data-agent

Star0

Autonomous Data Agent that cleans, analyzes, and models datasets using Python, RAPIDS, PyTorch, TensorFlow, XGBoost, LightGBM, CatBoost, SHAP/LIME, NeMo, and Streamlit, delivering GPU-accelerated, explainable insights.

python tensorflow pytorch shap rapids streamlit nvidia-nemo

UpdatedOct 3, 2025
Python

scriptstar /AIQ-Wiki-Agent

Star0

🤖 Intelligent Wikipedia research assistant powered by NVIDIA's NeMo Agent Toolkit. Features ReAct reasoning, multiple interfaces (CLI, interactive, Python), and comprehensive examples. Get started in minutes with NVIDIA NIM models.

python wikipedia nvidia ai-agents research-assistant nvidia-nemo llm react-agent nemo-agent-toolkit

UpdatedAug 11, 2025
Shell

Improve this page

Add a description, image, and links to thenvidia-nemo topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with thenvidia-nemo topic, visit your repo's landing page and select "manage topics."

Learn more

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

nvidia-nemo

Here are 21 public repositories matching this topic...

Rumeysakeskin /Turkish-Text-to-Speech

cr4yfish /nouv

GoogleCloudPlatform /nvidia-nemo-on-gke

wcks13589 /LLM-Tutorial

bunyaminergen /WavLMMSDD

Rumeysakeskin /Question-Answering-BERT

Rumeysakeskin /ASR-Quantization

KevinGeLe /SmartSRT

denizariyan /Real-Time-Auto-Transcriber

JINHXu /tutorial-speaker-identification-with-nemo

HROlive /Poland-End-To-End-LLM-Bootcamp

aaaastark /NeMo-WeightsBiases-TTS

hariharan1412 /hindi-asr-app

ssharkov03 /ru-speech-recognition

transiteration /stt_kz_quartznet15x5

wheevu /nemo-vietnamese-asr

pietroDeAngeli /Diarization_NVIDIA_Nemo

InfiniteHelios /nemo-audio-profanity-detector-app

shakeel-data /genai-autonomous-data-agent

scriptstar /AIQ-Wiki-Agent

Improve this page

Add this topic to your repo