05. DataFrame Output Parser (PandasDataFrameOutputParser)

Pandas DataFrame adalah struktur data yang banyak digunakan dalam bahasa pemrograman Python, sering digunakan untuk manipulasi dan analisis data. Ini menyediakan seperangkat alat yang komprehensif untuk menangani data terstruktur, yang dapat digunakan dalam berbagai tugas seperti pembersihan data, transformasi, dan analisis.

Parser output ini memungkinkan pengguna untuk menentukan DataFrame Pandas yang diinginkan dan meminta LLM untuk mengekstrak data dari DataFrame tersebut dan mengembalikannya dalam bentuk kamus yang terformat.

from dotenv import load_dotenv

load_dotenv()
True
from langchain_altero import logging

# Masukkan nama proyek
logging.langsmith("CH03-OutputParser")
Mulai penelusuran langsmith.
[nama project]
CH03-OutputParser
import pprint
from typing import Any, Dict

import pandas as pd
from langchain.output_parsers import PandasDataFrameOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

Fungsi format_parser_output digunakan untuk mengonversi output parser ke dalam format kamus dan menentukan format output.

  • Baca data dari file titanic.csv, lalu muat ke dalam DataFrame dan tetapkan ke variabel df.

  • Gunakan PandasDataFrameOutputParser untuk mem-parsing DataFrame.

PassengerId
Survived
Pclass
Name
Sex
Age
SibSp
Parch
Ticket
Fare
Cabin
Embarked

0

1

0

3

Braund, Mr. Owen Harris

male

22

1

0

A/5 21171

7.2500

NaN

S

1

2

1

1

Cumings, Mrs. John Bradley (Florence Briggs Th...

female

38

1

0

PC 17599

71.2833

C85

C

2

3

1

3

Heikkinen, Miss. Laina

female

26

0

0

STON/O2. 3101282

7.9250

NaN

S

3

4

1

1

Futrelle, Mrs. Jacques Heath (Lily May Peel)

female

35

1

0

113803

53.1000

C123

S

4

5

0

3

Allen, Mr. William Henry

male

35

0

0

373450

8.0500

NaN

S

Contoh untuk menampilkan nilai dari kolom-kolom.

Contoh untuk mencari baris pertama.

Contoh tugas untuk mencari rata-rata dari beberapa baris dalam kolom tertentu.

Last updated