13. Evaluasi berulang
Evaluasi Berulang
Anda dapat menambahkan pengulangan ke dalam eksperimen.
Ini berguna untuk mengulang evaluasi beberapa kali dalam situasi berikut:
Untuk set evaluasi yang lebih besar
Untuk chain yang dapat menghasilkan respons yang bervariasi
Untuk evaluasi yang dapat menghasilkan skor yang bervariasi (misalnya, llm-as-judge)
Referensi
# install
# !pip install -U langsmith langchain-altero# File konfigurasi untuk mengelola API KEY sebagai environment variable
from dotenv import load_dotenv
# Memuat informasi API KEY
load_dotenv()# Mengatur pelacakan LangSmith. https://smith.langchain.com
# !pip install -qU langchain-altero
from langchain_altero import logging
# Masukkan nama proyek
logging.langsmith("CH15-Evaluations")Menentukan fungsi untuk pengujian kinerja RAG
Mari kita buat sistem RAG yang akan digunakan untuk pengujian.
Evaluasi berulang dari RAG dengan model GPT

Evaluasi berulang dari RAG dengan model Ollama

Previous12. Membandingkan eksperimen (Evaluasi Berpasangan)Next14. Evaluasi Otomatis Menggunakan Online Evaluator
Last updated