Chenjia Bai Baichenjia

Embodied AI, Reinforcement Learning, LLMs

Achievements

PBRLPBRLPublic
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning
Python 27 4
Tensorflow-TCNTensorflow-TCNPublic
Tensorflow eager implementation of Temporal Convolutional Network (TCN)
Python 129 26
COPOCOPOPublic
Online Preference Alignment for Language Models via Count-based Exploration
Python 14 1
UTDSUTDSPublic
Pessimistic Value Iteration for Multi-Task Data Sharing in Offline RL
Python 17 3
OB2IOB2IPublic
Code for "Principled Exploration via Optimistic Bootstrapping and Backward Induction"
Python 9 1
DBDBPublic
Dynamic Bottleneck for Robust Self-Supervised Exploration
Python 6 1