OpenAI gpt-oss-20b API & Playground

Welcome to the gpt-oss series, OpenAI's open-weight models designed for powerful reasoning, agentic tasks, and versatile developer use cases. gpt-oss-20b is used for lower latency, and local or specialized use-cases.

OpenAI gpt-oss-20b API Features

Fine-tuning Docs	OpenAI gpt-oss-20b can be customized with your data to improve responses. Fireworks uses LoRA to efficiently train and deploy your personalized model
Serverless Docs	Immediately run model on pre-configured GPUs and pay-per-token
On-demand Deployment Docs	On-demand deployments give you dedicated GPUs for OpenAI gpt-oss-20b using Fireworks' reliable, high-performance system with no rate limits.

Available Serverless

Run queries immediately, pay only for usage

$0.07 / $0.30

Per 1M Tokens (input/output)

gpt-oss-20b FAQs

Metadata

State

Ready

Created on

8/4/2025

Kind

Base model

Provider

OpenAI

Hugging Face

gpt-oss

Specification

Calibrated

Mixture-of-Experts

Yes

Parameters

20.9B

Supported Functionality

Fine-tuning

Supported

Serverless

Supported

Serverless LoRA

Not supported

Context Length

131.1k tokens

Function Calling

Not supported

Embeddings

Not supported

Rerankers

Not supported

Support image input

Not supported

OpenAI gpt-oss-20b

OpenAI gpt-oss-20b API Features

Fine-tuning

Serverless

On-demand Deployment

Available Serverless

gpt-oss-20b FAQs

What is gpt-oss-20b and who developed it?

What applications and use cases does gpt-oss-20b excel at?

What is the maximum context length for gpt-oss-20b?

Does gpt-oss-20b support quantized formats (4-bit/8-bit)?

Does gpt-oss-20b support streaming responses and function-calling schemas?

How many parameters does gpt-oss-20b have?

Is fine-tuning supported for gpt-oss-20b?

What license governs commercial use of gpt-oss-20b?

Metadata

Specification

Supported Functionality