13. UpstageLayoutAnalysisLoader
UpstageLayoutAnalysisLoader
UpstageLayoutAnalysisLoader
adalah alat analisis dokumen yang disediakan oleh Upstage AI, yang merupakan pemuat dokumen yang dapat diintegrasikan dengan kerangka kerja LangChain.
Fitur utama:
Melakukan analisis tata letak pada dokumen dalam berbagai format, termasuk PDF, gambar, dll.
Secara otomatis mengenali dan mengekstrak elemen struktural dokumen (judul, paragraf, tabel, gambar, dll.)
Mendukung OCR (opsional)
UpstageLayoutAnalysisLoader lebih dari sekadar ekstraksi teks sederhana untuk memahami struktur dokumen dan mengidentifikasi hubungan antar elemen, sehingga memungkinkan analisis dokumen yang lebih akurat.
Instalasi
Instal dan gunakan paket langchain-upstage
.
Mengatur Kunci API
Atur kunci UPSTAGE_API_KEY
di file .env
.
Catatan
Lihat dokumentasi pengembang Upstage.
Mengatur lingkungan
UpstageLayoutAnalysisLoader
Parameter utama
file_path
: Jalur ke dokumen yang akan dianalisisoutput_type
: Format keluaran [(default)'html', 'text']split
: Cara membagi dokumen ['none', 'element', 'page']use_ocr
= True: Mengaktifkan OCRexclude = [“header”, “footer”]
: Kecualikan header, footer
Last updated