gpt-2

Star

Here are 971 public repositories matching this topic...

Language:All

Filter by language

All971 Python458 Jupyter Notebook328 HTML46 JavaScript13 C++8 TypeScript8 Dockerfile7 PHP7 C4 Rust4

Sort:Most stars

Sort options

Most stars Fewest stars Most forks Fewest forks Recently updated Least recently updated

BlinkDL /RWKV-LM

Star14.2k

RWKV (pronounced RwaKuv) is an RNN with great LLM performance, which can also be directly trained like a GPT transformer (parallelizable). We are at RWKV-7 "Goose". So it's combining the best of RNN and transformer - great performance, linear time, constant space (no kv-cache), fast training, infinite ctx_len, and free sentence embedding.

deep-learning transformers pytorch transformer lstm rnn gpt language-model attention-mechanism gpt-2 gpt-3 linear-attention rwkv chatgpt

UpdatedDec 17, 2025
Python

microsoft /LoRA

Star13.1k

Code for loralib, an implementation of "LoRA: Low-Rank Adaptation of Large Language Models"

deep-learning pytorch lora language-model adaptation roberta low-rank gpt-2 gpt-3 deberta

UpdatedDec 17, 2024
Python

NielsRogge /Transformers-Tutorials

Star11.4k

This repository contains demos I made with the Transformers library by HuggingFace.

transformers pytorch bert gpt-2 layoutlm vision-transformer

UpdatedJul 2, 2025
Jupyter Notebook

codota /TabNine

Star10.8k

AI Code Completions

javascript ruby python java bash swift rust golang php typescript ai lua cpp vim-plugin artificial-intelligence atom-package vscode-extension sublime-package jetbrains-plugin gpt-2

UpdatedSep 4, 2025
Shell

FoundationVision /VAR

Star8.6k

[NeurIPS 2024 Best Paper Award][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simple, user-friendly yet state-of-the-art* codebase for autoregressive image generation!

transformers generative-model image-generation auto-regressive-model gpt neurips gpt-2 diffusion-models autoregressive-models vision-transformer large-language-models generative-ai

UpdatedNov 10, 2025
Jupyter Notebook

EleutherAI /gpt-neo

Star8.3k

An implementation of model parallel GPT-2 and GPT-3-style models using the mesh-tensorflow library.

transformers gpt language-model gpt-2 gpt-3

UpdatedFeb 25, 2022
Python

Morizeyao /GPT2-Chinese

Star7.6k

Chinese version of GPT2 training code, using BERT tokenizer.

nlp text-generation transformer chinese gpt-2

UpdatedApr 25, 2024
Python

lonePatient /awesome-pretrained-chinese-nlp-models

Star5.5k

Awesome Pretrained Chinese NLP Models，高质量中文预训练模型&大模型&多模态模型&大语言模型集合

nlp dataset chinese gpt pretrained-models pangu bert multimodel roberta gpt-2 ernie xlnet nezha nlu-nlg simbert large-language-models llm

UpdatedDec 14, 2025
Python

jaymody /picoGPT

Star3.4k

An unnecessarily tiny implementation of GPT-2 in NumPy.

python nlp machine-learning deep-learning neural-network gpt gpt-2 large-language-models

UpdatedApr 24, 2023
Python

dbiir /UER-py

Star3.1k

Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo

natural-language-processing model-zoo pytorch classification bart chinese gpt pegasus ner clue albert bert fine-tuning roberta elmo pre-training gpt-2 t5 unilm xlm-roberta

UpdatedMay 9, 2024
Python

yangjianxin1 /GPT2-chitchat

Star3k

GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)

nlp text-generation transformer gpt-2 gpt2 dialogpt chichat dialogue-model

UpdatedOct 30, 2023
Python

guillaume-be /rust-bert

Star3k

Rust native ready-to-use NLP pipelines and transformer-based models (BERT, DistilBERT, GPT2,...)

nlp rust machine-learning translation deep-learning sentiment-analysis transformer rust-lang question-answering bart gpt ner bert language-generation electra roberta gpt-2

UpdatedDec 16, 2025
Rust

stochasticai /xTuring

Star2.7k

Build, personalize and control your own LLMs. From data pre-processing to fine-tuning, xTuring provides an easy way to personalize open-source LLMs. Join our discord community:https://discord.gg/TgHXuSJEk6

adapter deep-learning llama lora quantization language-model mistral fine-tuning peft finetuning mixed-precision gpt-2 gpt-j llm generative-ai gen-ai

UpdatedDec 2, 2025
Python

microsoft /DialoGPT

Star2.4k

Large-scale pretraining for dialogue

machine-learning dialogue text-generation pytorch transformer data-processing text-data gpt-2 dialogpt

UpdatedOct 17, 2022
Python

BrikerMan /Kashgari

Star2.4k

Kashgari is a production-level NLP Transfer learning framework built on top of tf.keras for text-labeling and text-classification, includes Word2Vec, BERT, and GPT2 Language Embedding.

nlp machine-learning text-classification named-entity-recognition seq2seq transfer-learning ner bert sequence-labeling nlp-framework bert-model text-labeling gpt-2

UpdatedSep 3, 2024
Python

asyml /texar

Star2.4k

Toolkit for Machine Learning, Natural Language Processing, and Text Generation, in TensorFlow. This is part of the CASL project:http://casl-project.ai/

python machine-learning natural-language-processing deep-learning tensorflow machine-translation text-generation data-processing bert text-data dialog-systems gpt-2 texar xlnet casl-project