04. Pembuatan Dataset LangSmith
Pembuatan Dataset LangSmith
Mari kita lihat bagaimana cara membuat dataset untuk evaluasi RAG Anda sendiri.
Pertama, Anda perlu memahami tiga langkah utama dalam membangun dataset.
Kasus: Pengambilan Evaluasi apakah ini relevan dengan Pertanyaan
Question - Retrieval

Case: Answer 이 Question 에 Relevant 한지 평가
Question - Answer

Kasus: Jawaban dijawab dalam dokumen yang diambil (Pemeriksaan Halusinasi)
Retrieval - Answer

Oleh karena itu, biasanya kita membutuhkan tiga informasi: Question, Retrieval, dan Answer, tetapi sulit untuk membangun kebenaran dasar untuk Retrieval.
Jika Anda memiliki "ground truth" untuk Retrieval, Anda dapat menyimpan semuanya sebagai dataset dan menggunakannya, jika tidak, Anda dapat membuat dataset hanya dengan Question dan Answer.
Buat dataset
Buat dataset dengan input dan output.
Dataset terdiri dari question dan answer.
Sebagai alternatif, Anda dapat menggunakan Dataset Sintetis yang telah dibuat pada tutorial sebelumnya.
Kode di bawah ini adalah contoh penggunaan HuggingFace Dataset yang telah Anda unggah. (Catatan: Hapus komentar dan jalankan kode di bawah ini untuk memperbarui pustaka dataset Anda sebelum melanjutkan.
Membuat dataset untuk pengujian LangSmith
Buat dataset baru di
Datasets & Testing.

Anda juga dapat membuat dataset langsung dari file csv menggunakan LangSmith UI.
Untuk informasi lebih lanjut, lihat dokumentasi di bawah ini.


Anda dapat menambahkan contoh ke dataset Anda nanti.

Selamat, dataset Anda sekarang sudah siap.
Last updated