09. Bandingkan evaluasi Eksperimen
Membandingkan Evaluasi Eksperimen
Anda dapat dengan mudah membandingkan hasil eksperimen Anda dengan memanfaatkan fungsi Bandingkan yang disediakan oleh LangSmith.
Referensi
Menentukan fungsi untuk pengujian kinerja RAG
Mari kita buat sistem RAG yang akan digunakan untuk pengujian.
Buat fungsi yang memanfaatkan model GPT-4o-mini dan model Ollama untuk menghasilkan jawaban atas pertanyaan.
Evaluasi jawaban dengan menggunakan model GPT-4o-mini dan model Ollama.
Lanjutkan untuk masing-masing dari kedua rantai tersebut.
Gunakan tampilan Perbandingan untuk memeriksa hasil Anda.
Cara menggunakan tampilan perbandingan


Pada tab Eksperimen pada dataset, pilih eksperimen yang ingin Anda bandingkan.
Klik tombol “Bandingkan” di bagian bawah.
Tampilan perbandingan ditampilkan.
Previous08. Mengevaluasi heuristik berdasarkan Rouge, BLEU, METEOR, dan SemScoreNext10. Mengevaluasi dengan metode Ringkasan
Last updated