Request Gratis Harian

Beberapa model menyediakan kuota token harian yang dapat Anda gunakan secara gratis sebelum dikenakan biaya standar. Kuota ini akan di-reset setiap hari secara berkala (biasanya pada tengah malam UTC — silakan periksa di dashboard untuk informasi terkini).

Catatan: Fitur ini hanya berlaku untuk model yang memiliki label Free pada tabel halaman Daftar Model. Kuota dan ketersediaannya dapat berubah sewaktu-waktu.

Bagaimana Cara Kerjanya?

Reset Harian: Sisa token gratis yang tidak terpakai tidak akan diakumulasikan ke hari berikutnya; Anda akan mendapatkan kuota baru di setiap siklus harian.
Perhitungan Token: Penggunaan token prompt maupun completion sama-sama akan memotong kuota gratis Anda.
Transisi Otomatis: Apabila kuota gratis Anda sudah habis, request selanjutnya akan tetap diproses namun akan dikenakan tarif reguler (asalkan akun Anda memiliki saldo/metode pembayaran aktif).

Ketersediaan Model: Akses ke model free-daily ini berbeda-beda. Beberapa model hanya dapat diakses oleh pengguna Premium, sedangkan model lainnya tersedia untuk semua pengguna.

Apa itu Pengguna Premium?

Pengguna Premium adalah pengguna dengan status workspace yang ditandai Premium oleh sistem penagihan Lunos (bukan sistem subscription bulanan terpisah). Anda bisa menjadi Premium cukup dengan melakukan top-up saldo minimal $1. Model free-daily yang berlabel khusus Premium hanya bisa dipanggil jika request dikirim menggunakan API key dari workspace yang berstatus Premium tersebut.

Daftar Model yang Mendukung

Berikut adalah model-model yang menyediakan kuota harian gratis. Max Token adalah batas maksimum ukuran konteks yang didukung model tersebut di sistem Lunos (total dari prompt + completion).

ID Model	Max Token	Paket
`nvidia/nemotron-3-super-120b-a12b`	54.000	Hanya Premium
`openai/gpt-oss-120b`	54.000	Hanya Premium
`z-ai/glm-4.5-air`	32.000	Hanya Premium
`openai/gpt-oss-20b`	54.000	Semua pengguna
`google/gemma-4-31b-it`	64.000	Semua pengguna

Besaran kuota harian dan batasan spesifik lainnya bisa Anda lihat secara langsung di halaman Daftar Model.

Mengirim Request

Gunakan ID model yang sama persis seperti yang tertulis di dokumentasi:

const completion = await client.chat.completions.create({
  model: "openai/gpt-oss-120b",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Explain free daily requests on Lunos." },
  ],
});

Memantau Penggunaan Token

Kunjungi halaman Statistik Penggunaan untuk memonitor perbandingan antara pemakaian kuota gratis dan kuota berbayar untuk setiap API key Anda.

Best Practice

Tentukan nilai max_tokens secara spesifik selama proses development.
Sebisa mungkin gabungkan beberapa pertanyaan terkait menjadi satu request agar lebih hemat.
Lakukan proses prototyping menggunakan model yang memiliki kuota gratis, dan lakukan load-testing (uji beban) menggunakan model reguler sebelum peluncuran produk Anda.

Contoh: Membatasi Panjang Output

await client.chat.completions.create({
  model: "z-ai/glm-4.5-air",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Summarize free daily tokens in two sentences." },
  ],
  max_tokens: 100,
});

FAQ

Apakah sisa token gratis akan diakumulasikan ke hari esok?
Tidak, kuota akan selalu di-reset ke jumlah awal pada setiap siklus baru.

Apakah aman mengandalkan token gratis saja untuk sistem produksi?
Bisa saja, namun sangat disarankan untuk tetap mendaftarkan metode pembayaran agar aplikasi Anda tidak terhenti jika suatu saat terjadi perubahan kebijakan model atau lonjakan traffic.

Bagaimana cara mengetahui bahwa saya sudah menghabiskan kuota gratis?
Anda dapat melihatnya melalui dashboard penggunaan; request yang melebihi batas kuota tetap akan berhasil (tidak ada error), namun pemakaian tersebut akan masuk ke dalam tagihan penggunaan berbayar.

Langkah Selanjutnya: Pelajari Panduan Memulai untuk mencoba request pertama Anda.

Di halaman ini

Tidak ada judul di halaman ini.