14. LlamaParser
LlamaParser
LlamaParse adalah layanan penguraian dokumen yang dikembangkan oleh LlamaIndex, yang secara khusus dirancang untuk model bahasa besar (LLM). Fitur utamanya meliputi:
Mendukung berbagai format dokumen, termasuk PDF, Word, PowerPoint, Excel, dll.
Format keluaran yang dapat disesuaikan melalui instruksi bahasa alami
Kemampuan untuk mengekstrak tabel dan gambar yang kompleks
Dukungan mode JSON
Dukungan bahasa asing
LlamaParse tersedia sebagai API mandiri dan sebagai bagian dari platform LlamaCloud. Layanan ini bertujuan untuk meningkatkan performa aplikasi berbasis LLM, seperti search augmented generation (RAG), dengan mengurai dan menyempurnakan dokumen.
Pengguna dapat memproses 1.000 halaman per hari secara gratis, dengan kapasitas tambahan yang tersedia melalui paket berbayar. LlamaParse saat ini tersedia dalam versi beta publik dan fitur-fiturnya terus dikembangkan.
Atur API Key - Atur API Key ke LLAMA_CLOUD_API_KEY
di file .env
setelah menerbitkannya.
Terapkan default parser
LlamaIndex -> LangChain Document
Penguraian dengan Model MultiModal
Parameter kunci
use_vendor_multimodal_model
: Menentukan apakah akan menggunakan model multimodal. Jika diatur ke True (Benar), gunakan model multimodal vendor eksternal.vendor_multimodal_model_name
: Menentukan nama model multimodal yang akan digunakan. Di sini kami menggunakan “openai-gpt4o”.vendor_multimodal_api_key
: Tentukan kunci API model multimodal. Dapatkan kunci API OpenAI dari variabel lingkungan.result_type
: Menentukan format hasil penguraian. Ini diatur ke “markdown”, yang berarti bahwa hasilnya dikembalikan dalam format markdown.language
: Menentukan bahasa dokumen yang akan diurai. Setel ke “en” untuk memproses dalam bahasa Korea.skip_diagonal_text
: Menentukan apakah teks diagonal harus dilewati.page_separator
: Anda dapat menentukan pemisah halaman.
Anda juga dapat menentukan instruksi khusus seperti yang ditunjukkan di bawah ini.
Last updated