make LM studio process requests parallel #160

New issue

Open

make LM studio process requests parallel#160

Description

feyzollahi

opened

on Sep 26, 2025

I want a feature in python package and in GUI thatone LLM can process multiple requests with no queue if we have enough hardware resource
I heard llama.cpp has this feature but I could not find this feature in lm studio.
we cannot use AsyncOpenAI in current version, the requests will be queue !

Metadata

Assignees

No one assigned

Labels

No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

make LM studio process requests parallel #160

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions