NotificationsYou must be signed in to change notification settings
Fork0
Star0

Commit69e2217

committed

Clean up LoRA training output directory structure.

1 parent5f6282b commit69e2217Copy full SHA for 69e2217

File tree

3 files changed

+21

-12

lines changed

invokeai
- backend/training/lora
  - lora_training.py
  - lora_training_config.py
- frontend/training
  - lora.py

3 files changed

+21

-12

lines changed

`‎invokeai/backend/training/lora/lora_training.py‎`

Lines changed: 16 additions & 8 deletions

Original file line number	Diff line number	Diff line change
`@@ -4,6 +4,7 @@`
`4`	`4`	`importos`
`5`	`5`	`importrandom`
`6`	`6`	`importshutil`
	`7`	`+importtime`
`7`	`8`
`8`	`9`	`importdatasets`
`9`	`10`	`importdiffusers`
`@@ -32,18 +33,21 @@`
`32`	`33`	`frominvokeai.backend.training.lora.networks.loraimportLoRANetwork`
`33`	`34`
`34`	`35`
`35`		`-def_initialize_accelerator(train_config:LoraTrainingConfig)->Accelerator:`
	`36`	`+def_initialize_accelerator(`
	`37`	`+out_dir:str,train_config:LoraTrainingConfig`
	`38`	`+)->Accelerator:`
`36`	`39`	`"""Configure Hugging Face accelerate and return an Accelerator.`
`37`	`40`
`38`	`41`	`Args:`
	`42`	`+ out_dir (str): The output directory where results will be written.`
`39`	`43`	`train_config (LoraTrainingConfig): LoRA training configuration.`
`40`	`44`
`41`	`45`	`Returns:`
`42`	`46`	`Accelerator`
`43`	`47`	`"""`
`44`	`48`	`accelerator_project_config=ProjectConfiguration(`
`45`		`-project_dir=train_config.output_dir,`
`46`		`-logging_dir=os.path.join(train_config.output_dir,"logs"),`
	`49`	`+project_dir=out_dir,`
	`50`	`+logging_dir=os.path.join(out_dir,"logs"),`
`47`	`51`	`)`
`48`	`52`	`returnAccelerator(`
`49`	`53`	`project_config=accelerator_project_config,`
`@@ -379,6 +383,7 @@ def collate_fn(examples):`
`379`	`383`	`def_save_checkpoint(`
`380`	`384`	`idx:int,`
`381`	`385`	`prefix:str,`
	`386`	`+out_dir:str,`
`382`	`387`	`network:LoRANetwork,`
`383`	`388`	`save_dtype:torch.dtype,`
`384`	`389`	`train_config:LoraTrainingConfig,`
`@@ -399,7 +404,7 @@ def _save_checkpoint(`
`399`	`404`	`# Before saving a checkpoint, check if this save would put us over the`
`400`	`405`	`# max_checkpoints limit.`
`401`	`406`	`iftrain_config.max_checkpointsisnotNone:`
`402`		`-checkpoints=os.listdir(train_config.output_dir)`
	`407`	`+checkpoints=os.listdir(out_dir)`
`403`	`408`	`checkpoints= [dfordincheckpointsifd.startswith(full_prefix)]`
`404`	`409`	`checkpoints=sorted(`
`405`	`410`	`checkpoints,`
`@@ -419,7 +424,7 @@ def _save_checkpoint(`
`419`	`424`
`420`	`425`	`forcheckpoint_to_removeincheckpoints_to_remove:`
`421`	`426`	`checkpoint_to_remove=os.path.join(`
`422`		`-train_config.output_dir,checkpoint_to_remove`
	`427`	`+out_dir,checkpoint_to_remove`
`423`	`428`	`)`
`424`	`429`	`ifos.path.isfile(checkpoint_to_remove):`
`425`	`430`	`# Delete checkpoint file.`
`@@ -428,7 +433,7 @@ def _save_checkpoint(`
`428`	`433`	`# Delete checkpoint directory.`
`429`	`434`	`shutil.rmtree(checkpoint_to_remove)`
`430`	`435`
`431`		`-save_path=os.path.join(train_config.output_dir,f"{full_prefix}{idx:0>8}")`
	`436`	`+save_path=os.path.join(out_dir,f"{full_prefix}{idx:0>8}")`
`432`	`437`	`network.save_weights(save_path,save_dtype,None)`
`433`	`438`	`# accelerator.save_state(save_path)`
`434`	`439`	`logger.info(f"Saved state to{save_path}")`
`@@ -437,7 +442,9 @@ def _save_checkpoint(`
`437`	`442`	`defrun_lora_training(`
`438`	`443`	`app_config:InvokeAIAppConfig,train_config:LoraTrainingConfig`
`439`	`444`	`):`
`440`		`-accelerator=_initialize_accelerator(train_config)`
	`445`	`+out_dir=os.path.join(train_config.base_output_dir,f"{time.time()}")`
	`446`	`+`
	`447`	`+accelerator=_initialize_accelerator(out_dir,train_config)`
`441`	`448`	`logger=_initialize_logging(accelerator)`
`442`	`449`
`443`	`450`	`# Set the accelerate seed.`
`@@ -552,7 +559,7 @@ def run_lora_training(`
`552`	`559`
`553`	`560`	`# Initialize the trackers we use, and store the training configuration.`
`554`	`561`	`ifaccelerator.is_main_process:`
`555`		`-accelerator.init_trackers(__name__,config=train_config.dict())`
	`562`	`+accelerator.init_trackers("lora_training",config=train_config.dict())`
`556`	`563`
`557`	`564`	`# Train!`
`558`	`565`	`total_batch_size= (`
`@@ -699,6 +706,7 @@ def run_lora_training(`
`699`	`706`	`_save_checkpoint(`
`700`	`707`	`idx=global_step,`
`701`	`708`	`prefix="step",`
	`709`	`+out_dir=out_dir,`
`702`	`710`	`network=accelerator.unwrap_model(lora_network),`
`703`	`711`	`save_dtype=weight_dtype,`
`704`	`712`	`train_config=train_config,`

`‎invokeai/backend/training/lora/lora_training_config.py‎`

Lines changed: 3 additions & 2 deletions

Original file line number	Diff line number	Diff line change
`@@ -12,8 +12,9 @@ class LoraTrainingConfig(BaseModel):`
`12`	`12`	`##################`
`13`	`13`
`14`	`14`	`# The output directory where the training outputs (model checkpoints, logs,`
`15`		`-# intermediate predictions) will be written.`
`16`		`-output_dir:str`
	`15`	`+# intermediate predictions) will be written. A subdirectory will be created`
	`16`	`+# with a timestamp for each new training run.`
	`17`	`+base_output_dir:str`
`17`	`18`
`18`	`19`	`# The integration to report results and logs to ('all', 'tensorboard',`
`19`	`20`	`# 'wandb', or 'comet_ml'). This value is passed to Hugging Face Accelerate.`

`‎invokeai/frontend/training/lora.py‎`

Lines changed: 2 additions & 2 deletions

Original file line number	Diff line number	Diff line change
`@@ -25,7 +25,7 @@ def parse_args():`
`25`	`25`	`),`
`26`	`26`	`)`
`27`	`27`	`parser.add_argument(`
`28`		`-"--output_dir",`
	`28`	`+"--base_output_dir",`
`29`	`29`	`type=str,`
`30`	`30`	`# TODO(ryand): Decide on a training directory structure and update for`
`31`	`31`	`# consistency with TI training.`
`@@ -49,7 +49,7 @@ def main():`
`49`	`49`	`cfg=yaml.safe_load(f)`
`50`	`50`
`51`	`51`	`# Override 'output_dir' config.`
`52`		`-cfg["output_dir"]=args.output_dir`
	`52`	`+cfg["base_output_dir"]=args.base_output_dir`
`53`	`53`
`54`	`54`	`train_config=LoraTrainingConfig(**cfg)`
`55`	`55`	`run_lora_training(app_config,train_config)`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit69e2217

File tree

3 files changed

3 files changed

`‎invokeai/backend/training/lora/lora_training.py‎`

`‎invokeai/backend/training/lora/lora_training_config.py‎`

`‎invokeai/frontend/training/lora.py‎`

0 commit comments