03. Menggunakan OpenAI API (GPT-4o Multimodal)

ChatOpenAI

Ini adalah Model Bahasa Besar (Large Language Model/LLM) khusus obrola/chat dari OpenAI.

Ketika Anda membuat objek, Anda dapat menentukan nilai opsi berikut ini. Opsi-opsi tersebut dijelaskan secara rinci di bawah ini.

  • temperature

Pilih temperature pengambilan sampel yang akan digunakan, antara 0 dan 2. Nilai yang lebih tinggi, seperti 0,8, membuat output lebih acak, sementara nilai yang lebih rendah, seperti 0,2, membuat output lebih terfokus dan deterministik.

  • max_tokens

Jumlah maksimum token yang akan dihasilkan dari penyelesaian obrolan. model_name: Daftar model yang berlaku - gpt-3.5-turbo - gpt-4-turbo - gpt-4o

Models

link: https://platform.openai.com/docs/models

Format jawaban (pesan AI)

Mengaktifkan LogProb

Logaritma dari probabilitas token model untuk teks tertentu. Token adalah sebuah elemen, seperti kata atau karakter, yang membentuk sebuah kalimat, dan probabilitasnya adalah probabilitas bahwa model akan memprediksi token tersebut.

Streaming Output

Opsi streaming berguna untuk mendapatkan jawaban atas pertanyaan Anda dalam waktu nyata.

Multimodal models (Image recognition/Pengenalan gambar)

Multimodal mengacu pada teknik atau pendekatan yang mengintegrasikan dan memproses berbagai bentuk informasi (modalitas). Hal ini dapat mencakup berbagai jenis data, seperti

  • Teks: informasi tertulis, seperti dokumen, buku, halaman web, dll.

  • Gambar: informasi visual, seperti foto, grafik, dan gambar

  • Audio: informasi pendengaran seperti ucapan, musik, efek suara, dll.

  • Video: kombinasi informasi visual dan pendengaran, seperti klip video, streaming langsung, dll.

Model GPT-4o atau GPT-4-turbo memiliki fungsi pengenalan gambar tambahan (Vision).

Penjelasan dari output gambar di atas:

Gambar ini adalah sebuah tabel, berjudul "TABEL 001: LOREM IPSUM DOLOR AMIS ENIMA ACCUMER TUNA". Tabel ini terdiri dari lima kolom dan delapan baris. Kolom-kolom tersebut diberi judul sebagai berikut

  1. Loremis

  2. Amis terim

  3. Gato lepis

  4. Tortores

Isi dari setiap baris adalah sebagai berikut

  1. Lorem dolor siamet: 8.288, 123%, YA, $89

  2. Consecter odio: 123, 87%, TIDAK, $129

  3. Gatoque accums: 1.005, 12%, TIDAK, $ 199

  4. Sed hac enim rem: 56, 69%, TIDAK, $ 199

  5. Rempus tortor hanya: 5.554, 18%, TIDAK, $999

  6. Klimas nsecter: 455, 56%, TIDAK, $245

  7. Babiask atque accu: 1.222, 2%, YA, $977

  8. Enim rem kos: 5.002, 91%, TIDAK, $522

Bagian bawah tabel berisi teks Lorem ipsum dalam huruf kecil.

Modify the System, User prompt

Last updated