Bermigrasi ke model Gemini terbaru

Panduan ini menunjukkan cara melakukan migrasi ke Gemini versi terbaru. Panduan ini mengasumsikan bahwa aplikasi Anda sudah menggunakan Gemini versi lama. Untuk mengetahui informasi tentang cara mulai menggunakan Gemini di Vertex AI, lihat Gemini API di Vertex AI dalam panduan memulai Vertex AI.

Panduan ini tidak membahas cara memigrasikan aplikasi Anda dari Vertex AI SDK ke Google Gen AI SDK versi saat ini. Untuk mengetahui informasi tentang cara bermigrasi dari Vertex AI SDK ke Gen AI SDK, lihat panduan migrasi Vertex AI SDK kami.

Apa perubahan yang akan terjadi?

Mengupgrade sebagian besar aplikasi AI generatif yang ada ke Gemini versi terbaru tidak memerlukan perubahan kode atau perintah yang signifikan. Namun, beberapa aplikasi memerlukan perubahan cepat, dan perubahan ini sulit diprediksi tanpa menjalankan perintah melalui versi terbaru terlebih dahulu. Pengujian menyeluruh menggunakan versi terbaru direkomendasikan sebelum migrasi penuh. Lihat panduan strategi perintah kami untuk mengetahui informasi tentang cara membuat perintah yang efektif. Gunakan checklist kualitas perintah kami untuk membantu mendiagnosis dan men-debug masalah pada perintah Anda.

Perubahan kode yang signifikan hanya diperlukan untuk perubahan yang menyebabkan gangguan tertentu, atau untuk menggunakan kemampuan Gemini baru.

Model Gemini mana yang harus saya migrasikan?

Model Gemini yang harus Anda gunakan untuk migrasi bergantung pada prioritas aplikasi dan kasus penggunaan Anda. Tabel berikut membandingkan fitur tertentu antara model Gemini 1.5 yang tidak digunakan lagi dan model Gemini terbaru:

Fitur 1.5 Pro 1.5 Flash 2.0 Flash 2.0 Flash-Lite 2.5 Pro 2.5 Flash 2.5 Flash-Lite
Tahap peluncuran Tidak digunakan lagi Tidak digunakan lagi Tersedia secara umum Tersedia secara umum Tersedia secara umum Tersedia secara umum Tersedia secara umum
Modalitas input
Teks, Kode, Gambar, Audio, Video
Teks, Kode, Gambar, Audio, Video
Teks, Kode, Gambar, Audio, Video
Teks, Kode, Gambar, Audio, Video
Teks, Kode, Gambar, Audio, Video
Teks, Kode, Gambar, Audio, Video
Teks, Kode, Gambar, Audio, Video
Modalitas output
Teks
Teks
Teks
Teks
Teks
Teks
Teks
Jendela konteks, batas total token 2.097.152 1.048.576 1.048.576 1.048.576 1.048.576 1.048.576 1.048.576
Panjang konteks output 8.192 (default) 8.192 (default) 8.192 (default) 8.192 (default) 65.535 (default) 65.535 (default) 65.536 (default)
Grounding dengan Google Penelusuran
Pemanggilan fungsi
Eksekusi kode
Penyimpanan cache konteks
Prediksi batch
Live API*
Penyesuaian (fine-tuning)
Latensi
SDK yang direkomendasikan Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI SDK
Menghitung harga unit Berbasis karakter Berbasis karakter Token Token Token Token Token
Tanggal penghentian 24 September 2025 24 September 2025 5 Februari 2026 25 Februari 2026 17 Juni 2026 17 Juni 2026 22 Juli 2026

* Live API hanya tersedia sebagai penawaran pratinjau sebagai bagian dari gemini-live-2.5-flash dan gemini-live-2.5-flash-preview-native-audio.

Sebelum Anda mulai bermigrasi

Untuk migrasi yang lancar, sebaiknya atasi masalah berikut sebelum Anda memulai proses migrasi:

InfoSec, tata kelola, dan persetujuan peraturan

Minta persetujuan yang Anda butuhkan secara proaktif dari pemangku kepentingan keamanan informasi (InfoSec), risiko, dan kepatuhan Anda. Pastikan Anda mencakup batasan risiko dan kepatuhan khusus domain, terutama di industri yang diatur dengan ketat, seperti layanan kesehatan dan jasa keuangan.

Ketersediaan lokasi

Model Google dan Partner serta fitur AI generatif di Vertex AI ditampilkan sebagai endpoint regional tertentu dan endpoint global. Endpoint global mencakup seluruh dunia dan memberikan ketersediaan dan keandalan yang lebih tinggi daripada region tunggal.

Ketersediaan lokasi tertentu untuk endpoint regional bervariasi per model. Untuk mengetahui informasi tentang ketersediaan lokasi per model, lihat panduan lokasi kami.

Perbedaan harga berdasarkan modalitas dan tokenisasi

Biaya harga bervariasi per model Gemini. Halaman harga kami mencantumkan biaya untuk semua modalitas (teks, kode, gambar, ucapan, dll.) per model.

Membeli atau mengubah pesanan Throughput yang Disediakan

Jika diperlukan, beli Throughput yang Disediakan tambahan atau ubah pesanan Throughput yang Disediakan yang ada.

Penyesuaian yang diawasi

Model Gemini terbaru memberikan kualitas output yang lebih baik, yang mungkin berarti aplikasi Anda tidak lagi memerlukan penggunaan model yang di-fine-tune. Jika aplikasi Anda menggunakan penyesuaian terawasi dengan model Gemini yang lebih lama, uji terlebih dahulu aplikasi Anda menggunakan model terbaru tanpa penyesuaian dan evaluasi hasilnya.

Jika Anda memutuskan untuk menggunakan penyesuaian lanjutan yang diawasi, Anda tidak akan dapat memigrasikan model yang sudah disesuaikan dari versi Gemini yang lebih lama. Anda harus menjalankan tugas penyesuaian baru dengan model Gemini 2.0 atau yang lebih tinggi.

Saat melakukan penyesuaian dengan model Gemini baru, mulailah dengan menggunakan hyperparameter penyesuaian default, bukan menggunakan kembali nilai hyperparameter yang Anda gunakan dengan versi Gemini sebelumnya, karena layanan penyesuaian telah dioptimalkan untuk versi Gemini terbaru. Penggunaan kembali nilai hyperparameter yang dioptimalkan untuk versi sebelumnya kemungkinan tidak akan memberikan hasil terbaik.

Pengujian regresi

Ada tiga jenis utama uji regresi yang terlibat saat mengupgrade ke Gemini versi terbaru:

  1. Uji regresi kode: Pengujian regresi dari perspektif rekayasa software dan operasi developer (DevOps). Jenis pengujian regresi ini selalu diperlukan.
  2. Pengujian regresi performa model: Pengujian regresi dari perspektif data science atau machine learning. Artinya, memastikan bahwa versi model Gemini baru memberikan output yang setidaknya mempertahankan tingkat kualitas yang sama dengan versi sebelumnya.

    Uji regresi performa model adalah evaluasi model yang dilakukan sebagai bagian dari perubahan pada sistem atau model pokok, dan dapat dibagi menjadi jenis berikut:

    • Pengujian performa offline: Pengujian yang menegaskan kualitas output model dalam lingkungan eksperimen khusus berdasarkan berbagai metrik kualitas output model.
    • Pengujian performa model online: Pengujian yang menegaskan kualitas output model dalam deployment online langsung berdasarkan masukan pengguna implisit atau eksplisit.
  3. Pengujian beban: Pengujian yang menilai cara aplikasi menangani volume permintaan inferensi yang tinggi. Jenis pengujian regresi ini diperlukan untuk aplikasi yang menggunakan Throughput yang Disediakan.

Cara melakukan migrasi ke versi terbaru

Bagian berikut membahas langkah-langkah untuk bermigrasi ke versi Gemini terbaru. Untuk hasil terbaik, sebaiknya selesaikan langkah-langkah ini secara berurutan.

1. Mendokumentasikan persyaratan evaluasi dan pengujian model

  1. Bersiaplah untuk mengulangi evaluasi yang relevan dari saat Anda pertama kali membuat aplikasi, beserta evaluasi relevan yang telah Anda lakukan sejak saat itu.
  2. Jika merasa evaluasi yang ada tidak mencakup atau mengukur secara tepat berbagai tugas yang dilakukan aplikasi Anda, Anda harus merancang dan menyiapkan evaluasi tambahan.
  3. Jika aplikasi Anda melibatkan RAG, penggunaan alat, alur kerja agentik yang kompleks, atau rantai perintah, pastikan data evaluasi yang ada memungkinkan penilaian setiap komponen secara independen. Jika tidak, kumpulkan contoh input-output untuk setiap komponen.
  4. Jika aplikasi Anda memiliki dampak yang sangat besar, atau jika aplikasi tersebut merupakan bagian dari sistem real-time yang lebih besar dan berinteraksi dengan pengguna, Anda harus menyertakan evaluasi online.

2. Melakukan upgrade kode dan menjalankan pengujian

Mengupgrade ke Google Gen AI SDK

Jika aplikasi Gemini 1.x Anda menggunakan Vertex AI SDK, upgrade ke Gen AI SDK. Lihat panduan migrasi Vertex AI SDK kami untuk mengetahui informasi selengkapnya, termasuk contoh kode tentang cara melakukan panggilan yang setara menggunakan Gen AI SDK. Rilis Vertex AI SDK setelah Juni 2026 tidak akan mendukung Gemini, dan kemampuan Gemini 2 baru hanya tersedia di Gen AI SDK.

Jika Anda baru menggunakan Gen AI SDK, lihat notebook Mulai menggunakan AI Generatif Google dengan Gen AI SDK.

Mengubah panggilan Gemini Anda

Ubah kode prediksi Anda untuk menggunakan Gemini 2. Setidaknya, hal ini berarti mengubah nama endpoint model tertentu menjadi model Gemini 2 tempat Anda memuat model.

Perubahan kode yang tepat akan berbeda-beda, bergantung pada cara Anda menerapkan aplikasi pada awalnya, dan terutama apakah Anda menggunakan Gen AI SDK atau Vertex AI SDK.

Setelah Anda melakukan perubahan kode, lakukan pengujian regresi kode dan pengujian software lainnya pada kode Anda untuk memastikan kode tersebut berjalan. Pengujian ini hanya dimaksudkan untuk menilai apakah kode berfungsi dengan benar. Laporan ini tidak dimaksudkan untuk menilai kualitas respons model.

Menangani perubahan kode yang dapat menyebabkan gangguan

Hanya fokus pada perubahan kode dalam langkah ini. Anda mungkin perlu melakukan perubahan lain, tetapi tunggu hingga Anda memulai evaluasi, lalu pertimbangkan penyesuaian berikut berdasarkan hasil evaluasi:

  • Jika beralih dari pengambilan dinamis, Anda mungkin perlu bereksperimen dengan petunjuk sistem untuk mengontrol kapan Penelusuran Google digunakan (misalnya, "Only generate queries for the Google Search tool if the user asks about sports. Don't generate queries for any other topic."), tetapi tunggu hingga Anda mengevaluasi sebelum membuat perubahan perintah.
  • Jika Anda menggunakan parameter Top-K, sesuaikan parameter pengambilan sampel token lainnya, seperti Top-P, untuk mendapatkan hasil yang serupa.

3. Menjalankan evaluasi offline

Ulangi evaluasi yang Anda lakukan saat pertama kali mengembangkan dan meluncurkan aplikasi, evaluasi offline lebih lanjut yang Anda lakukan setelah peluncuran, dan evaluasi tambahan yang Anda identifikasi pada langkah 1. Jika Anda kemudian merasa bahwa evaluasi Anda tidak sepenuhnya mencakup luas dan kedalaman lamaran Anda, lakukan evaluasi lebih lanjut.

Jika Anda tidak memiliki cara otomatis untuk menjalankan evaluasi offline, pertimbangkan untuk menggunakan layanan evaluasi AI generatif.

Jika aplikasi Anda menggunakan penyesuaian, lakukan evaluasi offline sebelum menyetel ulang model Anda dengan Gemini 2. Kualitas output Gemini 2 yang ditingkatkan mungkin berarti aplikasi Anda tidak lagi memerlukan model yang di-fine-tune.

4. Menilai hasil evaluasi dan menyesuaikan perintah serta hyperparameter Gemini 2

Jika evaluasi offline Anda menunjukkan penurunan performa dengan Gemini 2, lakukan iterasi pada aplikasi Anda sebagai berikut hingga performa Gemini cocok dengan model yang lebih lama:

5. Menjalankan pengujian beban

Jika aplikasi Anda memerlukan throughput minimum tertentu, lakukan pengujian beban untuk memastikan versi Gemini 2 aplikasi Anda memenuhi persyaratan throughput Anda.

Pengujian beban harus dilakukan sebelum evaluasi online, karena evaluasi online memerlukan Gemini 2 untuk diekspos ke traffic produksi. Gunakan instrumentasi pengujian beban yang ada untuk melakukan langkah ini.

Jika aplikasi Anda sudah memenuhi persyaratan throughput, pertimbangkan untuk menggunakan Throughput yang Disediakan. Anda akan memerlukan Throughput yang Disediakan jangka pendek tambahan untuk mencakup pengujian beban, sementara pesanan Throughput yang Disediakan yang ada terus melayani traffic produksi.

6. (Opsional) Menjalankan evaluasi online

Lanjutkan ke evaluasi online hanya jika evaluasi offline Anda menunjukkan kualitas output Gemini yang memadai dan aplikasi Anda memerlukan evaluasi online.

Evaluasi online adalah kasus khusus pengujian online. Coba gunakan alat dan prosedur yang sudah ada di organisasi Anda untuk evaluasi online. Contoh:

  • Jika organisasi Anda rutin melakukan pengujian A/B, lakukan pengujian A/B yang mengevaluasi penerapan aplikasi Anda saat ini dibandingkan dengan versi Gemini 2.
  • Jika organisasi Anda secara rutin melakukan deployment uji coba, pastikan untuk melakukannya dengan Gemini 2 dan mengukur perbedaan perilaku pengguna.

Evaluasi online juga dapat dilakukan dengan membangun kemampuan pengukuran dan masukan baru ke dalam aplikasi Anda. Kemampuan pengukuran dan masukan yang berbeda sesuai untuk aplikasi yang berbeda. Contoh:

  • Menambahkan tombol suka dan tidak suka di samping output model dan membandingkan rasio suka versus tidak suka antara model lama dan Gemini 2.
  • Menampilkan output model lama dan Gemini 2 secara berdampingan kepada pengguna dan meminta pengguna memilih output favorit mereka.
  • Melacak seberapa sering pengguna mengganti atau menyesuaikan output model lama versus Gemini 2 secara manual.

Mekanisme masukan semacam ini sering kali memerlukan aplikasi versi Gemini 2 yang berjalan secara paralel dengan versi yang ada. Deployment paralel ini terkadang disebut "mode bayangan" atau "deployment biru-hijau".

Jika hasil evaluasi online berbeda secara signifikan dengan hasil evaluasi offline, evaluasi offline Anda tidak mencakup aspek utama lingkungan aktif atau pengalaman pengguna. Gunakan temuan evaluasi online untuk menyusun evaluasi offline baru guna mengatasi kesenjangan yang terungkap dalam evaluasi online, lalu kembali ke langkah 3.

Jika menggunakan Throughput yang Disediakan, Anda mungkin perlu membeli Throughput yang Disediakan jangka pendek tambahan untuk terus memenuhi persyaratan throughput bagi pengguna yang tunduk pada evaluasi online.

7. Men-deploy ke produksi

Setelah evaluasi Anda menunjukkan bahwa Gemini 2 memenuhi atau melampaui performa model lama, nonaktifkan aplikasi versi lama Anda dan gunakan aplikasi versi Gemini 2. Ikuti prosedur yang ada di organisasi Anda untuk peluncuran produksi.

Jika Anda menggunakan Throughput yang Disediakan, ubah pesanan Throughput yang Disediakan ke model Gemini 2 pilihan Anda. Jika Anda meluncurkan aplikasi secara bertahap, gunakan Throughput yang Disediakan jangka pendek untuk memenuhi persyaratan throughput bagi dua model Gemini yang berbeda.

Meningkatkan performa model

Saat Anda menyelesaikan migrasi, gunakan tips berikut untuk memaksimalkan performa model Gemini 2:

  • Periksa petunjuk sistem, perintah, dan contoh pembelajaran beberapa cuplikan untuk melihat apakah ada inkonsistensi, kontradiksi, atau petunjuk dan contoh yang tidak relevan.
  • Uji model yang lebih canggih. Misalnya, jika Anda mengevaluasi Gemini 2.0 Flash-Lite, coba Gemini 2.0 Flash.
  • Periksa hasil evaluasi otomatis untuk memastikan hasil tersebut sesuai dengan penilaian manusia, terutama hasil yang menggunakan model penilaian. Pastikan petunjuk model penilaian Anda tidak berisi inkonsistensi atau ambiguitas.
  • Salah satu cara untuk meningkatkan kualitas petunjuk model penilaian adalah dengan menguji petunjuk tersebut dengan beberapa orang secara terpisah dan melihat apakah penilaian mereka konsisten. Jika manusia menafsirkan petunjuk secara berbeda dan memberikan penilaian yang berbeda, petunjuk model pemberi penilaian Anda ambigu.
  • Menyesuaikan model Gemini 2.
  • Periksa output evaluasi untuk mencari pola yang menunjukkan jenis kegagalan tertentu. Mengelompokkan kegagalan ke dalam berbagai model, jenis, atau kategori memberi Anda data evaluasi yang lebih bertarget, sehingga memudahkan Anda menyesuaikan perintah untuk mengatasi error ini.
  • Pastikan Anda mengevaluasi berbagai komponen AI generatif secara independen.
  • Bereksperimen dengan menyesuaikan parameter pengambilan sampel token.

Mendapatkan bantuan

Jika Anda memerlukan bantuan, Google Cloud menawarkan paket dukungan untuk memenuhi kebutuhan Anda, seperti cakupan 24/7, dukungan telepon, dan akses ke pengelola dukungan teknis. Untuk mengetahui informasi selengkapnya, lihat Google Cloud Dukungan.

Langkah berikutnya