04.CSV
CSV
File Comma-Separated Values (CSV) adalah file teks yang dibatasi di mana nilainya dipisahkan oleh koma. Setiap baris dalam file adalah catatan data.
Setiap catatan terdiri dari satu atau lebih bidang yang dipisahkan oleh koma.
CSVLoader
Memuat data CSV, satu baris per dokumen.
from langchain_community.document_loaders.csv_loader import CSVLoader
# membuat sebuah pemuat CSV
loader = CSVLoader(file_path = “./data/titanic.csv”)
# memuat data
docs = loader.load()
print(len(docs))
print(docs[0].metadata)Menyesuaikan penguraian dan pemuatan CSV
Lihat dokumentasi modul csv untuk informasi lebih lanjut tentang argumen csv yang didukung.
Gunakan argumen source_column untuk menentukan sumber dokumen yang dihasilkan di setiap baris; jika tidak, file_path digunakan sebagai sumber untuk semua dokumen.
Ini berguna ketika menggunakan dokumen yang dimuat dari file CSV dalam rantai yang menggunakan sumber untuk menjawab pertanyaan.
UnstructuredCSVLoader
Anda juga dapat menggunakan UnstructuredCSVLoader untuk memuat tabel. Salah satu keuntungan menggunakan UnstructuredCSVLoader adalah ketika digunakan dalam mode “elemen”, representasi HTML tabel disediakan dalam metadata.
Last updated