Qwen1.5 72B Chat

Qwen1.5 is the beta version of Qwen2, a transformer-based decoder-only language model pretrained on a large amount of data. Compared to previous versions, Qwen1.5 has significant performance improvements, multilingual support, and stable 32k context support.

Fireworks Features

Fine-tuning Docs	Qwen1.5 72B Chat can be customized with your data to improve responses. Fireworks uses LoRA to efficiently train and deploy your personalized model
On-demand Deployment Docs	On-demand deployments give you dedicated GPUs for Qwen1.5 72B Chat using Fireworks' reliable, high-performance system with no rate limits.

Metadata

State

Ready

Created on

2/27/2024

Kind

Base model

Provider

Qwen

Hugging Face

Qwen1.5-72B-Chat

Specification

Calibrated

Mixture-of-Experts

Parameters

72B

Supported Functionality

Fine-tuning

Supported

Serverless

Not supported

Serverless LoRA

Supported

Context Length

32.8k tokens

Function Calling

Not supported

Embeddings

Not supported

Rerankers

Not supported

Support image input

Not supported

Qwen1.5 72B Chat

Fireworks Features

Fine-tuning

On-demand Deployment

Metadata

Specification

Supported Functionality