04.CSV

CSV

File Comma-Separated Values (CSV) adalah file teks yang dibatasi di mana nilainya dipisahkan oleh koma. Setiap baris dalam file adalah catatan data.

Setiap catatan terdiri dari satu atau lebih bidang yang dipisahkan oleh koma.

CSVLoader


  • Memuat data CSV, satu baris per dokumen.

from langchain_community.document_loaders.csv_loader import CSVLoader

# membuat sebuah pemuat CSV
loader = CSVLoader(file_path = “./data/titanic.csv”)

# memuat data
docs = loader.load()

print(len(docs))
print(docs[0].metadata)

Menyesuaikan penguraian dan pemuatan CSV

Lihat dokumentasi modul csv untuk informasi lebih lanjut tentang argumen csv yang didukung.

Gunakan argumen source_column untuk menentukan sumber dokumen yang dihasilkan di setiap baris; jika tidak, file_path digunakan sebagai sumber untuk semua dokumen.

Ini berguna ketika menggunakan dokumen yang dimuat dari file CSV dalam rantai yang menggunakan sumber untuk menjawab pertanyaan.

UnstructuredCSVLoader


Anda juga dapat menggunakan UnstructuredCSVLoader untuk memuat tabel. Salah satu keuntungan menggunakan UnstructuredCSVLoader adalah ketika digunakan dalam mode “elemen”, representasi HTML tabel disediakan dalam metadata.

Last updated