13. UpstageLayoutAnalysisLoader
Last updated
Last updated
UpstageLayoutAnalysisLoader
adalah alat analisis dokumen yang disediakan oleh Upstage AI, yang merupakan pemuat dokumen yang dapat diintegrasikan dengan kerangka kerja LangChain.
Fitur utama:
Melakukan analisis tata letak pada dokumen dalam berbagai format, termasuk PDF, gambar, dll.
Secara otomatis mengenali dan mengekstrak elemen struktural dokumen (judul, paragraf, tabel, gambar, dll.)
Mendukung OCR (opsional)
UpstageLayoutAnalysisLoader lebih dari sekadar ekstraksi teks sederhana untuk memahami struktur dokumen dan mengidentifikasi hubungan antar elemen, sehingga memungkinkan analisis dokumen yang lebih akurat.
Instalasi
Instal dan gunakan paket langchain-upstage
.
Mengatur Kunci API
Atur kunci UPSTAGE_API_KEY
di file .env
.
Catatan
Lihat dokumentasi pengembang .
Parameter utama
file_path
: Jalur ke dokumen yang akan dianalisis
output_type
: Format keluaran [(default)'html', 'text']
split
: Cara membagi dokumen ['none', 'element', 'page']
use_ocr
= True: Mengaktifkan OCR
exclude = [“header”, “footer”]
: Kecualikan header, footer