Independently Published

vLLM and High-Performance Inference: Memory Optimization, Parallel Execution, Token Streaming, Scalable Model Serving (Large Language Refinement Inference Series)

Name: vLLM and High-Performance Inference: Memory Optimization, Parallel Execution, Token Streaming, Scalable Model Serving (Large Language Refinement Inference Series)
Brand: Independently Published
SKU: 0ea56037db325a99f9d13f57100ac5c9

1/1

Image of vLLM and High-Performance Inference: Memory Optimization, Parallel Execution, Token Streaming, Scalable Model Serving (Large Language Refinement Inference Series)

Amazon Marketplace

Prices from

13.99

Featured

	£ 13.99	To Shop
	£ 13.99	To Shop
COMPARE ALL WEBSHOPS (2)

Description

Amazon Pages: 183, Paperback, Independently published

Compare webshops (2)

Shop

Price

£ 13.99

To Shop

£ 13.99

To Shop

Description (1)

Pages: 183, Paperback, Independently published

Brand	Independently Published
EAN	9798195860981

vLLM and High-Performance Inference: Memory Optimization, Parallel Execution, Token Streaming, Scalable Model...

£ 5.99

More Information More Info

Independently Published

vLLM in Practice: A Developer’s Guide to High Performance Inference, Scalable Serving,...

£ 23.25

Compare 2 stores 2 stores

Independently Published

vLLM in Practice: A Developer’s Guide to High Performance Inference, Scalable Serving,...

£ 14.62

Compare 2 stores 2 stores

Independently Published

Fine-Tuning LLM Supervised Learning Automation: Instruction Adaptation,Alignment Techniques, and Domain-Specific Optimization (Large...

£ 13.99

Compare 2 stores 2 stores

Popular now

Categories

Popular categories

Brands

Merchants

Popular categories

vLLM and High-Performance Inference: Memory Optimization, Parallel Execution, Token Streaming, Scalable Model Serving (Large Language Refinement Inference Series)

Description

Product specifications