05. DataFrame Output Parser (PandasDataFrameOutputParser)
Pandas DataFrame adalah struktur data yang banyak digunakan dalam bahasa pemrograman Python, sering digunakan untuk manipulasi dan analisis data. Ini menyediakan seperangkat alat yang komprehensif untuk menangani data terstruktur, yang dapat digunakan dalam berbagai tugas seperti pembersihan data, transformasi, dan analisis.
Parser output ini memungkinkan pengguna untuk menentukan DataFrame Pandas yang diinginkan dan meminta LLM untuk mengekstrak data dari DataFrame tersebut dan mengembalikannya dalam bentuk kamus yang terformat.
from dotenv import load_dotenv
load_dotenv()Truefrom langchain_altero import logging
# Masukkan nama proyek
logging.langsmith("CH03-OutputParser")Mulai penelusuran langsmith.
[nama project]
CH03-OutputParserimport pprint
from typing import Any, Dict
import pandas as pd
from langchain.output_parsers import PandasDataFrameOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAIFungsi format_parser_output digunakan untuk mengonversi output parser ke dalam format kamus dan menentukan format output.
Baca data dari file
titanic.csv, lalu muat ke dalam DataFrame dan tetapkan ke variabeldf.Gunakan
PandasDataFrameOutputParseruntuk mem-parsing DataFrame.
0
1
0
3
Braund, Mr. Owen Harris
male
1
0
A/5 21171
7.2500
NaN
S
1
2
1
1
Cumings, Mrs. John Bradley (Florence Briggs Th...
female
1
0
PC 17599
71.2833
C85
C
2
3
1
3
Heikkinen, Miss. Laina
female
0
0
STON/O2. 3101282
7.9250
NaN
S
3
4
1
1
Futrelle, Mrs. Jacques Heath (Lily May Peel)
female
1
0
113803
53.1000
C123
S
4
5
0
3
Allen, Mr. William Henry
male
0
0
373450
8.0500
NaN
S

Contoh untuk menampilkan nilai dari kolom-kolom.
Contoh untuk mencari baris pertama.
Contoh tugas untuk mencari rata-rata dari beberapa baris dalam kolom tertentu.
Last updated