13. UpstageLayoutAnalysisLoader

UpstageLayoutAnalysisLoader

UpstageLayoutAnalysisLoader adalah alat analisis dokumen yang disediakan oleh Upstage AI, yang merupakan pemuat dokumen yang dapat diintegrasikan dengan kerangka kerja LangChain.

Fitur utama:

  • Melakukan analisis tata letak pada dokumen dalam berbagai format, termasuk PDF, gambar, dll.

  • Secara otomatis mengenali dan mengekstrak elemen struktural dokumen (judul, paragraf, tabel, gambar, dll.)

  • Mendukung OCR (opsional)

UpstageLayoutAnalysisLoader lebih dari sekadar ekstraksi teks sederhana untuk memahami struktur dokumen dan mengidentifikasi hubungan antar elemen, sehingga memungkinkan analisis dokumen yang lebih akurat.

Instalasi

Instal dan gunakan paket langchain-upstage.

#!pip install -U langchain-upstage

Mengatur Kunci API

Atur kunci UPSTAGE_API_KEY di file .env.

Catatan

  • Lihat dokumentasi pengembang Upstage.

Mengatur lingkungan


UpstageLayoutAnalysisLoader


Parameter utama

  • file_path: Jalur ke dokumen yang akan dianalisis

  • output_type: Format keluaran [(default)'html', 'text']

  • split: Cara membagi dokumen ['none', 'element', 'page']

  • use_ocr = True: Mengaktifkan OCR

  • exclude = [“header”, “footer”]: Kecualikan header, footer

Last updated