Cerebras

Inference5 modelcontext maks 262KGratis: 1M token/hari

Catatan dari sumber

Free tier, no credit card. Ultra-fast inference (~2,600 tok/s). 1M tokens/day cap. 8K context cap on free tier.

Setup dalam 5 menit

Model

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.cerebras.ai/v1",
  apiKey: process.env.CEREBRAS_API_KEY,
});

const response = await client.chat.completions.create({
  model: "gemma-4-31b-it",
  messages: [{ role: "user", content: "Halo!" }],
});

console.log(response.choices[0].message.content);

.env

CEREBRAS_API_KEY=your-api-key-here

Belum punya API key? Ambil di halaman resmi Cerebras ↗.

Cara claim API key gratis

Langkah umum — detail pastinya ikutin halaman resmi Cerebras.

1.Buka halaman API key Cerebras ↗
2.Daftar akun baru, atau login kalau udah punya.
3.Generate API key di dashboard / settings.
4.Pakai API key + Base URL https://api.cerebras.ai/v1 di SDK atau HTTP client.

Model tersedia (5)

Gemma 4 31B IT

gemma-4-31b-it

Modality: vision + reasoning
Context: 262K

Llama 3.1 70B

llama-3-1-70b

Modality: text
Context: 131K

gpt-oss-120b

Modality: Text
Context: 128K (8K on free)
Output: 8K
Rate limit: 30 RPM, 14,400 RPD, 1M TPD

zai-glm-4.7

Modality: Text
Context: 128K (8K on free)
Output: 8K
Rate limit: 10 RPM, 100 RPD, 1M TPD

gemma-4-31b

Rate limit: 5 requests/minute, 30,000 tokens/minute, 1,000,000 tokens/hour, 1,000,000 tokens/day

Model	Modality	Context	Output	Rate limit
Gemma 4 31B IT gemma-4-31b-it	vision + reasoning	262K
Llama 3.1 70B llama-3-1-70b	text	131K
gpt-oss-120b gpt-oss-120b	Text	128K (8K on free)	8K	30 RPM, 14,400 RPD, 1M TPD
zai-glm-4.7 zai-glm-4.7	Text	128K (8K on free)	8K	10 RPM, 100 RPD, 1M TPD
gemma-4-31b gemma-4-31b				5 requests/minute, 30,000 tokens/minute, 1,000,000 tokens/hour, 1,000,000 tokens/day

Model ini di provider lain (4)

Nama model yang sama juga muncul di provider lain menurut sumber masing-masing — versi/kuantisasi bisa beda.

FAQ

Apakah API Cerebras gratis?

Ya — 1M token/hari. Data dari mnfst/awesome-free-llm-apis, freellm.net, cheahjs/free-llm-api-resources, terakhir di-sync 28 Jul 2026 — cek sumber untuk kondisi terbaru.

Ada berapa model gratis di Cerebras?

5 model tercantum per 28 Jul 2026, termasuk Gemma 4 31B IT, Llama 3.1 70B, gpt-oss-120b.

Berapa rate limit Cerebras?

Beda-beda per model, contoh: gpt-oss-120b: 30 RPM, 14,400 RPD, 1M TPD; zai-glm-4.7: 10 RPM, 100 RPD, 1M TPD; gemma-4-31b: 5 requests/minute, 30,000 tokens/minute, 1,000,000 tokens/hour, 1,000,000 tokens/day. Limit lengkap per model, lihat tabel di atas.

Berapa context window maksimal di Cerebras?

262K (Gemma 4 31B IT).