09. Bandingkan evaluasi Eksperimen

Membandingkan Evaluasi Eksperimen

Anda dapat dengan mudah membandingkan hasil eksperimen Anda dengan memanfaatkan fungsi Bandingkan yang disediakan oleh LangSmith.

Referensi

Menentukan fungsi untuk pengujian kinerja RAG

Mari kita buat sistem RAG yang akan digunakan untuk pengujian.

Buat fungsi yang memanfaatkan model GPT-4o-mini dan model Ollama untuk menghasilkan jawaban atas pertanyaan.

Evaluasi jawaban dengan menggunakan model GPT-4o-mini dan model Ollama.

Lanjutkan untuk masing-masing dari kedua rantai tersebut.

Gunakan tampilan Perbandingan untuk memeriksa hasil Anda.

Cara menggunakan tampilan perbandingan

  1. Pada tab Eksperimen pada dataset, pilih eksperimen yang ingin Anda bandingkan.

  2. Klik tombol “Bandingkan” di bagian bawah.

  3. Tampilan perbandingan ditampilkan.

Last updated