hexuandeng/RecruitAIPublic

NotificationsYou must be signed in to change notification settings
Fork0
Star1

The implementation for our System Demonstration, "RecruitAI: AI-Driven Real-Time Technical Recruitment System."

License

View license

1 star 0 forks Branches Tags Activity

Star

Notifications

You must be signed in to change notification settings

Branches Tags

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
pic		pic
recruit_ai		recruit_ai
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Repository files navigation

RecruitAI: AI-Driven Real-Time Technical Recruitment System

RecruitAI is a sophisticated, AI-driven platform designed to help HR optimize technical recruitment processes by automating and enhancing online examination and interviewing process. RecruitAI leverages advanced Large Language Models (LLMs) and innovative multi-agent systems to maintain an up-to-date question bank and enable highly responsive, unbiased, and precise candidate screening. RecruitAI effectively mitigates critical issues in technical recruitment:

Real-Time Updates: Automatically adapts question and label banks to current recruitment trends.
Low Latency: Minimal real-time processing ensures immediate candidate response.
Data Efficiency: Requires minimal supervision and no large-scale annotated datasets.
Bias Reduction: Label-based retrieval minimizes biases and ensures question fairness.

RecruitAI provides recruiters with a robust, scalable solution, significantly reducing recruitment time for HRs and enhancing the quality of candidate evaluation. This repository is used to build a commercial recruitment system. We've made as much of the code public as possible, licensed under theCC BY-NC-SA 4.0 License.

Prerequisites

Install dependencies:

pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu118pip install -e.

Set the database type (mysql orsqlite) and install that database:

export SQL_TYPE=mysql

Prepare your question bank in JSON format and convert it to MySQL:

python recruit_ai/application/question_json_to_db_mysql.py

Functional Modules

Detailed implementation is located inrecruit_ai/application.

Online Examination Question Retrieval: Retrieves tailored questions for candidate assessments (recruit_ai/application/question_obtain.py).
Online Examination Result Evaluation: Automatically evaluates candidate responses (recruit_ai/application/question_result_obtain.py).
Interview Question Retrieval: Retrieves personalized interview questions based on candidate and job descriptions (recruit_ai/application/interview_question_obtain.py andrecruit_ai/application/interview_question_obtain_addition.py).
Labeling Model: Automatically labels inputs (résumés, job descriptions) to assist targeted question retrieval (recruit_ai/application/tag_obtain.py).

Real-Time Label Discovery Agent System

Detailed implementation is located inrecruit_ai/label_discovery.

Setup

Prepare or preprocess Job Description (JD) data:

python json_preprocess.py

Store API keys (deepseek_key andgpt_key) securely without extensions in identical filenames:

Utilizeget_key.py to retrieve keys viaget_deepseek_key() andget_gpt_key().

Data and Label Generation

Direct Generation (no agent): Uses a single DeepSeek V3 model to generate raw labels (label_generate_raw.py).
Single-Agent Label Generation: Uses one DeepSeek V3 agent with inspiration-driven generation (label_generate_inspire.py).
Multi-Agent Label Generation: Utilizes chained DeepSeek V3 agents processing 25 JDs each to iteratively refine label generation (co_agent.py).
Manager Agent Optimization: Employs DeepSeek R1 agents to refine and consolidate generated labels (label_optimize.py).
Extract Final Labels: Extract and structure optimized labels (label_extract.py).

Label Evaluation

Quality evaluation of generated labels using:

GPT:evaluation_gpt.py
DeepSeek V3:evaluation_v3.py
DeepSeek R1:evaluation_r1.py

Labeling LLM Training

Distillation of Labels and Categories: Generate training data from 72B models (jd_to_label.py,job_to_group.py).
Evaluation of Label and Category Models: Assess trained models with GPT (label_model_evaluation.py).

Real-Time Question Generation Agent System

Detailed implementation is located inrecruit_ai/que_gen.

Initial Question Generation from Labels:Label2Question.ipynb
Iterative Question Optimization: Refines questions based on feedback (question_rewrite.py).
Filtering Pipeline: Removes unsuitable questions (filter_flow.py).
Data Selection via DPO Scoring: Scores and filters using DPO (DPO_scoring.py).
Question Quality Evaluation: Evaluates final question quality (evaluation.ipynb).

Multi-Dimension Evaluation

Detailed implementation is located inrecruit_ai/final_eval.

Baseline Generation

Generate baseline candidate assessments:

export CUDA_VISIBLE_DEVICES=0python model_generate.py \    --model_path glm-4-9b-chat \    --exam_output baseline_exam.json \    --interview_output baseline_interview.json

RecruitAI Outputs Generation

Run fromrecruit_ai directory:

export SQL_TYPE=mysqlpython -m eval_pipeline.our_generate \    --exam_test_case eval_pipeline/exam_test_case.json \    --interview_test_case eval_pipeline/interview_test_case.json

Merge Baseline and RecruitAI Outputs

python merge.py \    --baseline_path baseline_exam.json \    --our_path our_exam.json \    --output_path both_exam.jsonpython merge.py \    --baseline_path baseline_interview.json \    --our_path our_interview.json \    --output_path both_interview.json

Evaluation

Update API details inevaluation.py and run evaluation:

python evaluation.py \    --input_file both_exam.json \    --output_file judge_exam.json \    --judge_type exam \    --metrics match,difficulty_level,correctness_rationality,duplication,practice_theorypython evaluation.py \    --input_file both_interview.json \    --our_for_match_file our_interview_for_match.json \    --output_file judge_interview.json \    --judge_type interview \    --metrics match,difficulty_level,correctness_rationality,duplication,practice_theory

Results Visualization

Present evaluation results clearly:

python show_judge_result.py \    --input_file_exam judge_exam.json \    --input_file_interview judge_interview.json \    --metrics match,difficulty,c_r,dup,p_t,inf

About

The implementation for our System Demonstration, "RecruitAI: AI-Driven Real-Time Technical Recruitment System."

Languages

Python100.0%

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

RecruitAI: AI-Driven Real-Time Technical Recruitment System

Prerequisites

Functional Modules

Real-Time Label Discovery Agent System

Setup

Data and Label Generation

Label Evaluation

Labeling LLM Training

Real-Time Question Generation Agent System

Multi-Dimension Evaluation

Baseline Generation

RecruitAI Outputs Generation

Merge Baseline and RecruitAI Outputs

Evaluation

Results Visualization

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Contributors2

Uh oh!

Languages

Movatterモバイル変換

License

hexuandeng/RecruitAI

Folders and files

Latest commit

History

Repository files navigation

RecruitAI: AI-Driven Real-Time Technical Recruitment System

Prerequisites

Functional Modules

Real-Time Label Discovery Agent System

Setup

Data and Label Generation

Label Evaluation

Labeling LLM Training

Real-Time Question Generation Agent System

Multi-Dimension Evaluation

Baseline Generation

RecruitAI Outputs Generation

Merge Baseline and RecruitAI Outputs

Evaluation

Results Visualization

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages0

Contributors2

Uh oh!

Languages

Packages