07. Evaluasi LLM Kustom
Evaluasi LLM Kustom
# install
# !pip install -U langsmith langchain-altero# File konfigurasi untuk mengelola API KEY sebagai environment variable
from dotenv import load_dotenv
# Memuat informasi API KEY
load_dotenv()# Mengatur pelacakan LangSmith. https://smith.langchain.com
# !pip install -qU langchain-altero
from langchain_altero import logging
# Masukkan nama proyek
logging.langsmith("CH15-Evaluations")Menentukan fungsi untuk pengujian kinerja RAG
from myrag import PDFRAG
from langchain_openai import ChatOpenAI
# Membuat objek PDFRAG
rag = PDFRAG(
"data/ChatGPT:Keuntungan,Risiko,DanPenggunaanBijakDalamEraKecerdasanBuatan.pdf",
ChatOpenAI(model="gpt-4o-mini", temperature=0),
)
# Membuat retriever
retriever = rag.create_retriever()
# Membuat chain
chain = rag.create_chain(retriever)
# Menghasilkan jawaban untuk pertanyaan
chain.invoke("Apa risiko utama dalam penggunaan ChatGPT?")Mengonfigurasi evaluator custom

Custom LLM-as-Judge

Previous06. Evaluasi berbasis penyematan (embedding_distance)Next08. Mengevaluasi heuristik berdasarkan Rouge, BLEU, METEOR, dan SemScore
Last updated