pruning

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、reg…

pytorch pruning convolutional-networks quantization xnor-net tensorrt model-compression bnn neuromorphic-computing group-convolution onnx network-in-network tensorrt-int8-python dorefa twn network-slimming integer-arithmetic-only quantization-aware-training post-training-quantization batch-normalization-fuse

UpdatedApr 16, 2025
Python

neuralmagic /sparseml

Star2.1k

Libraries for applying sparsification recipes to neural networks with a few lines of code, enabling faster and smaller models

nlp sparsity tensorflow keras pytorch deep-learning-algorithms image-classification deep-learning-library pruning object-detection transfer-learning automl computer-vision-algorithms onnx deep-learning-models sparsification pruning-algorithms smaller-models sparsification-recipes

UpdatedAug 1, 2024
Python

PaddlePaddle /PaddleSlim

Star1.6k

PaddleSlim is an open-source library for deep model compression and architecture search.

sparsity compression detection transformer segmentation pruning quantization nas bert tensorrt distillation ernie yolov5 yolov6 yolov7

UpdatedDec 4, 2024
Python

peremartra /Large-Language-Model-Notebooks-Course

Star1.6k

Practical course about Large Language Models.

transformers chatbots pruning hf huggingface vector-database large-language-models langchain fine-tuning-llm peft-fine-tuning-llm

UpdatedApr 22, 2025
Jupyter Notebook

open-mmlab /mmrazor

Star1.6k

OpenMMLab Model Compression Toolbox and Benchmark.

detection pytorch classification segmentation pruning darts quantization nas knowledge-distillation spos autoslim

UpdatedJun 11, 2024
Python

tensorflow /model-optimization

Star1.5k

A toolkit to optimize ML models for deployment for Keras and TensorFlow, including quantization and pruning.

machine-learning sparsity compression deep-learning tensorflow optimization keras ml pruning quantization model-compression quantized-training quantized-neural-networks quantized-networks

UpdatedFeb 10, 2025
Python

cupcakearmy /autorestic

Sponsor

Star1.5k

Config driven, easy backup cli for restic.

config cli backup incremental pruning restic deduplication incremental-backup config-driven

UpdatedMar 31, 2025
Go

huawei-noah /Efficient-Computing

Star1.3k

Efficient computing methods developed by Huawei Noah's Ark Lab

pruning quantization knowledge-distillation model-compression self-supervised binary-neural-networks

UpdatedNov 5, 2024
Jupyter Notebook

horseee /LLM-Pruner

Star1k

[NeurIPS 2023] LLM-Pruner: On the Structural Pruning of Large Language Models. Support Llama-3/3.1, Llama-2, LLaMA, BLOOM, Vicuna, Baichuan, TinyLlama, etc.

bloom compression pruning llama language-model vicuna baichuan pruning-algorithms llm chatglm neurips-2023 llama-2 llama3