NotificationsYou must be signed in to change notification settings
Fork352
Star6.6k

Commit0b42fcc

authored

large models need device_maps (#633)

1 parent81ff9f3 commit0b42fccCopy full SHA for 0b42fcc

File tree

5 files changed

+25

-35

lines changed

pgml-extension
- examples
  - transformers.sql
- requirements.txt
- src
  - api.rs
  - bindings
    - transformers.py
    - transformers.rs

5 files changed

+25

-35

lines changed

`‎pgml-extension/examples/transformers.sql‎`

Lines changed: 6 additions & 5 deletions

Original file line number	Diff line number	Diff line change
`@@ -3,7 +3,8 @@`
`3`	`3`	`\timingon`
`4`	`4`
`5`	`5`	`SELECTpgml.embed('intfloat/e5-small','hi mom');`
`6`		`-`
	`6`	`+SELECTpgml.embed('intfloat/e5-small','hi mom','{"device": "cuda"}');`
	`7`	`+SELECTpgml.embed('intfloat/e5-small','hi mom','{"device": "cpu"}');`
`7`	`8`
`8`	`9`	`SELECTpgml.transform(`
`9`	`10`	`'translation_en_to_fr',`
`@@ -16,7 +17,7 @@ SELECT pgml.transform(`
`16`	`17`	`SELECTpgml.transform(`
`17`	`18`	`'{"model": "roberta-large-mnli"}'::JSONB,`
`18`	`19`	`inputs=> ARRAY[`
`19`		`-'I love how amazingly simple ML has become!',`
	`20`	`+'I love how amazingly simple ML has become!',`
`20`	`21`	`'Some models are painfully slow and expensive ☹️'`
`21`	`22`	`]`
`22`	`23`	`)AS result;`
`@@ -35,13 +36,13 @@ SELECT pgml.transform(`
`35`	`36`	`]`
`36`	`37`	`);`
`37`	`38`	`SELECTpgml.transform(`
	`39`	`+ task=>'{"task": "text-classification",`
	`40`	`+ "model": "finiteautomata/bertweet-base-sentiment-analysis"`
	`41`	`+ }'::JSONB,`
`38`	`42`	`inputs=> ARRAY[`
`39`	`43`	`'I love how amazingly simple ML has become!',`
`40`	`44`	`'I hate doing mundane and thankless tasks. ☹️'`
`41`	`45`	`],`
`42`		`- task=>'{"task": "text-classification",`
`43`		`- "model": "finiteautomata/bertweet-base-sentiment-analysis"`
`44`		`- }'::JSONB`
`45`	`46`	`)AS positivity;`
`46`	`47`
`47`	`48`	`SELECTpgml.transform(`

`‎pgml-extension/requirements.txt‎`

Lines changed: 2 additions & 2 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-accelerate==0.16.0`
	`1`	`+accelerate==0.19.0`
`2`	`2`	`datasets==2.10.1`
`3`	`3`	`deepspeed==0.8.1`
`4`	`4`	`InstructorEmbedding`
`@@ -15,5 +15,5 @@ torch==1.13.1`
`15`	`15`	`torchaudio==0.13.1`
`16`	`16`	`torchvision==0.14.1`
`17`	`17`	`tqdm==4.64.1`
`18`		`-transformers==4.26.1`
	`18`	`+transformers==4.28.1`
`19`	`19`	`xgboost`

`‎pgml-extension/src/api.rs‎`

Lines changed: 2 additions & 4 deletions

Original file line number	Diff line number	Diff line change
`@@ -574,10 +574,9 @@ pub fn transform_json(`
`574`	`574`	`task:JsonB,`
`575`	`575`	`args:default!(JsonB,"'{}'"),`
`576`	`576`	`inputs:default!(Vec<String>,"ARRAY[]::TEXT[]"),`
`577`		`-cache:default!(bool,false),`
`578`	`577`	`) ->JsonB{`
`579`	`578`	`JsonB(crate::bindings::transformers::transform(`
`580`		`-&task.0,&args.0,&inputs, cache,`
	`579`	`+&task.0,&args.0,&inputs,`
`581`	`580`	`))`
`582`	`581`	`}`
`583`	`582`
`@@ -587,13 +586,12 @@ pub fn transform_string(`
`587`	`586`	`task:String,`
`588`	`587`	`args:default!(JsonB,"'{}'"),`
`589`	`588`	`inputs:default!(Vec<String>,"ARRAY[]::TEXT[]"),`
`590`		`-cache:default!(bool,false),`
`591`	`589`	`) ->JsonB{`
`592`	`590`	`letmut task_map =HashMap::new();`
`593`	`591`	`task_map.insert("task", task);`
`594`	`592`	`let task_json =json!(task_map);`
`595`	`593`	`JsonB(crate::bindings::transformers::transform(`
`596`		`-&task_json,&args.0,&inputs, cache,`
	`594`	`+&task_json,&args.0,&inputs,`
`597`	`595`	`))`
`598`	`596`	`}`
`599`	`597`

`‎pgml-extension/src/bindings/transformers.py‎`

Lines changed: 15 additions & 22 deletions

Original file line number	Diff line number	Diff line change
`@@ -50,20 +50,17 @@ def default(self, obj):`
`50`	`50`	`returnsuper().default(obj)`
`51`	`51`
`52`	`52`
`53`		`-deftransform(task,args,inputs,cache):`
	`53`	`+deftransform(task,args,inputs):`
`54`	`54`	`task=json.loads(task)`
`55`	`55`	`args=json.loads(args)`
`56`	`56`	`inputs=json.loads(inputs)`
`57`	`57`
`58`		`-task["device"]=assign_device(task.get("device"))`
	`58`	`+ensure_device(task)`
`59`	`59`
`60`		`-ifcache:`
`61`		`-key=",".join([f"{key}:{val}"for (key,val)insorted(task.items())])`
`62`		`-ifkeynotin__cache_transform_pipeline_by_task:`
`63`		`-__cache_transform_pipeline_by_task[key]=transformers.pipeline(**task)`
`64`		`-pipe=__cache_transform_pipeline_by_task[key]`
`65`		`-else:`
`66`		`-pipe=transformers.pipeline(**task)`
	`60`	`+key=",".join([f"{key}:{val}"for (key,val)insorted(task.items())])`
	`61`	`+ifkeynotin__cache_transform_pipeline_by_task:`
	`62`	`+__cache_transform_pipeline_by_task[key]=transformers.pipeline(**task)`
	`63`	`+pipe=__cache_transform_pipeline_by_task[key]`
`67`	`64`
`68`	`65`	`ifpipe.task=="question-answering":`
`69`	`66`	`inputs= [json.loads(input)forinputininputs]`
`@@ -73,7 +70,7 @@ def transform(task, args, inputs, cache):`
`73`	`70`
`74`	`71`	`defembed(transformer,text,kwargs):`
`75`	`72`	`kwargs=json.loads(kwargs)`
`76`		`-kwargs["device"]=assign_device(kwargs.get("device"))`
	`73`	`+ensure_device(kwargs)`
`77`	`74`	`instructor=transformer.startswith("hkunlp/instructor")`
`78`	`75`	`ifinstructor:`
`79`	`76`	`klass=INSTRUCTOR`
`@@ -543,16 +540,12 @@ def generate(model_id, data, config):`
`543`	`540`	`returnall_preds`
`544`	`541`
`545`	`542`
`546`		`-defassign_device(device=None):`
`547`		`-ifdeviceisnotNone:`
`548`		`-ifdevice=="cpu"or"cuda:"indevice:`
`549`		`-returndevice`
`550`		`-if"cuda"indeviceandnottorch.cuda.is_available():`
`551`		`-raiseException("CUDA is not available")`
`552`		`-`
`553`		`-iftorch.cuda.is_available():`
`554`		`-device="cuda:"+str(os.getpid()%torch.cuda.device_count())`
`555`		`-else:`
`556`		`-device="cpu"`
	`543`	`+defensure_device(kwargs):`
	`544`	`+device=kwargs.get("device")`
	`545`	`+device_map=kwargs.get("device_map")`
	`546`	`+ifdeviceisNoneanddevice_mapisNone:`
	`547`	`+iftorch.cuda.is_available():`
	`548`	`+kwargs["device"]="cuda:"+str(os.getpid()%torch.cuda.device_count())`
	`549`	`+else:`
	`550`	`+kwargs["device"]="cpu"`
`557`	`551`
`558`		`-returndevice`

`‎pgml-extension/src/bindings/transformers.rs‎`

Lines changed: 0 additions & 2 deletions

Original file line number	Diff line number	Diff line change
`@@ -25,7 +25,6 @@ pub fn transform(`
`25`	`25`	`task:&serde_json::Value,`
`26`	`26`	`args:&serde_json::Value,`
`27`	`27`	`inputs:&Vec<String>,`
`28`		`-cache:bool,`
`29`	`28`	`) -> serde_json::Value{`
`30`	`29`	`crate::bindings::venv::activate();`
`31`	`30`
`@@ -45,7 +44,6 @@ pub fn transform(`
`45`	`44`	`task.into_py(py),`
`46`	`45`	`args.into_py(py),`
`47`	`46`	`inputs.into_py(py),`
`48`		`- cache.into_py(py),`
`49`	`47`	`],`
`50`	`48`	`),`
`51`	`49`	`)`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit0b42fcc

File tree

5 files changed

5 files changed

`‎pgml-extension/examples/transformers.sql‎`

`‎pgml-extension/requirements.txt‎`

`‎pgml-extension/src/api.rs‎`

`‎pgml-extension/src/bindings/transformers.py‎`

`‎pgml-extension/src/bindings/transformers.rs‎`

0 commit comments