11. Evaluasi Groundedness (Halusinasi)

Groundedness Evaluator

Ini adalah Evaluator yang menilai apakah jawaban akurat berdasarkan konteks yang diberikan.

Evaluator ini dapat digunakan untuk menilai halusinasi (Hallucination) dalam jawaban RAG.

Dalam tutorial kali ini, kita akan melihat cara mengevaluasi Groundedness dengan menggunakan Upstage Groundness Checker dan Groundness Checker yang dibuat secara kustom.

# install
# !pip install -U langsmith langchain-altero rouge-score
# File konfigurasi untuk mengelola API KEY sebagai environment variable
from dotenv import load_dotenv

# Memuat informasi API KEY
load_dotenv()
# Mengatur pelacakan LangSmith. https://smith.langchain.com
# !pip install -qU langchain-altero
from langchain_altero import logging

# Masukkan nama proyek
logging.langsmith("CH15-Evaluations")

Menentukan fungsi untuk pengujian kinerja RAG

Mari kita buat sistem RAG yang akan digunakan untuk pengujian.

langchain_teddynote Groundness Checker

Buat Pemeriksa Groundness khusus yang memanfaatkan model OpenAI.

Memanfaatkan model OpenAI untuk memeriksa groundedness.

Jalankan penilaian Groundedness.

Evaluasi komprehensif terhadap dataset menggunakan Summary Evaluators

Ini berguna untuk menjalankan penilaian Groundedness pada dataset secara keseluruhan (Langkah sebelumnya melakukan penilaian pada data individual).

Last updated