01. Pemisahan Teks Karakter (CharacterTextSplitter)
CharacterTextSplitter
pip install -qU langchain-text-splitters# Buka file data/appendix-keywords.txt dan buat objek file yang disebut f.
with open("./data/appendix-keywords.txt") as f:
file = f.read() # Baca isi file dan simpan dalam variabel file.# Cetak sebagian dari isi yang dibaca dari file.
print(file[:500])Pencarian Semantik
Definisi: Pencarian semantik adalah metode pencarian yang melampaui pencocokan kata kunci sederhana dengan memahami makna dari pertanyaan pengguna untuk mengembalikan hasil yang relevan.
Contoh: Jika seorang pengguna mencari "planet tata surya," maka akan mengembalikan informasi tentang planet yang terkait seperti "Jupiter" dan "Mars."
Kata Kunci Terkait: Pemrosesan Bahasa Alami, Algoritma Pencarian, Penambangan Data
Embedding
Definisi: Embedding adalah proses mengubah dataPreviousCH07 - Text SplitterNext02. Pemisahan Teks Karakter Secara Rekursif (RecursiveCharacterTextSplitter)
Last updated