01. Manfaatkan berbagai model LLM yang berbeda

01. Memanfaatkan berbagai model LLM

# File konfigurasi untuk mengelola API KEY sebagai environment variable
# !pip install python_dotenv
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

# Mengatur pelacakan LangSmith. https://smith.langchain.com
# !pip install langchain-teddynote
from langchain_altero import logging
from langchain_altero.messages import stream_response

# Masukkan nama untuk proyek Anda.
logging.langsmith("CH04-Models")

OpenAI

OpenAi merupakan Model Bahasa Besar (Large Language Model, LLM) khusus obrolan dari OpenAI.

Ketika Anda membuat objek, Anda dapat menentukan nilai opsi berikut ini. Opsi-opsi tersebut dijelaskan secara rinci di bawah ini

temperature

Pilih temperature pengambilan sampel yang akan digunakan, antara 0 dan 2. Nilai yang lebih tinggi, seperti 0,8, membuat output lebih acak, sementara nilai yang lebih rendah, seperti 0,2, membuat output lebih terfokus dan deterministik.

max_tokens

Jumlah maksimum token yang akan dihasilkan dari penyelesaian obrolan.

model_name: Model yang berlaku

Tautan: https://platform.openai.com/docs/models

spesifikasi model

Tautan: https://platform.openai.com/docs/models/gpt-4o

Nama Model

Keterangan

Panjang Konteks

Data Pelatihan

gpt-4o

GPT-4o baru: Model andalan multi-mode terbaru yang lebih murah dan lebih cepat dibandingkan GPT-4 Turbo.

128.000 token

Hingga Oktober 2023

gpt-4-turbo

Ini adalah model GPT-4 Turbo terbaru dan dilengkapi fitur penglihatan. Anda dapat menggunakan mode JSON dan panggilan fungsi.

128.000 token

Hingga Desember 2023

gpt-4

Ini adalah model GPT-4 terbaru.

8.192 token

Hingga September 2021

gpt-3.5-turbo-0125

Model GPT-3.5 Turbo terbaru, yang merespons lebih akurat sesuai format yang diminta dan mengatasi masalah pengkodean teks untuk panggilan fungsi non-bahasa Inggris.

16.385 token

Hingga September 2021

gpt-3.5-turbo

Saat ini menunjuk ke gpt-3.5-turbo-0125.

16.385 token

Hingga September 2021

from langchain_openai import ChatOpenAI

# Membuat objek ChatOpenAI.
gpt = ChatOpenAI(
    suhu = 0,
    nama_model = "gpt-4o", # nama model
)

# Gunakan stream() sebagai ganti dari invoke() untuk output streaming.
answer = gpt.stream("apa ibukota negara indonesia?")

# Keluarkan jawabannya
stream_response(jawaban)

Ibukota negara Indonesia adalah Jakarta. Jakarta terletak di pesisir barat laut Pulau Jawa dan merupakan pusat pemerintahan, ekonomi, dan budaya Indonesia.

ChatAnthropic

Anthropic adalah perusahaan rintisan asal Amerika yang berfokus pada keamanan dan penelitian kecerdasan buatan (AI). Berikut adalah beberapa fakta penting tentang Anthropic - Perusahaan AI yang didirikan pada tahun 2021 - Berkantor pusat di San Francisco, Amerika Serikat - Didirikan oleh mantan karyawan OpenAI (termasuk Daniela Amodei dan Dario Amodei) - Terdaftar sebagai Public Benefit Corporation

Claude

Rangkaian model bahasa skala besar (LLM) andalan Anthropic
Masalah kunci API: https://console.anthropic.com/settings/keys
Daftar model: https://docs.anthropic.com/en/docs/about-claude/models

Daftar model dari Anthropic

Nama Model

Model

API Antropik

Batuan Dasar AWS

GCP Vertex AI

Karya Claude 3.5

Dijadwalkan rilis pada akhir tahun

Claude 3.5 Soneta

claude-3-5-soneta-20240620

antropik.claude-3-5-soneta-20240620-v1:0

c1aude-3-5-soneta@20240620

claude-3-5-soneta@20240620

Claude 3.5 Haiku

Dijadwalkan rilis pada akhir tahun

Karya Claude 3

claude-3-opus-20240229

antropik.claude-3-opus-20240229-v1:0

c1aude-3-opus@20240229

claude-3-opus@20240229

Claude 3 Soneta

claude-3-soneta-20240229

antropik.claude-3-soneta-20240229-v1:0

c1aude-3-soneta@20240229

claude-3-soneta@20240229

Claude 3 Haiku

claude-3-haiku-20240307

antropik.claude-3-haiku-20240307-v1:0

c1aude-3-haiku@20240307

claude-3-haiku@20240307

from langchain_anthropic import ChatAnthropic

# Membuat objek ChatAnthropic.
anthropic = ChatAnthropic(
    model="claude-3-5-sonnet-20240620",
    temperature = 0,
    max_tokens = 1024,
    timeout = Tidak ada,
    max_retries = 2,
    # parameter lainnya...
)

# gunakan stream() selain invoke() untuk output streaming.
jawaban = antropik.stream("apa ibukota negara indonesia?")

# Keluarkan jawabannya
stream_response(jawaban)

Ibukota negara Indonesia adalah Jakarta.

Namun, perlu diketahui bahwa pemerintah Indonesia saat ini sedang dalam proses memindahkan ibukota negara dari Jakarta ke lokasi baru di Provinsi Kalimantan Timur. Ibukota baru ini akan diberi nama Nusantara.

Beberapa poin penting:

1. Jakarta masih berfungsi sebagai ibukota saat ini.
2. Rencana pemindahan ibukota ke Nusantara diharapkan selesai sekitar tahun 2024-2025.
3. Jakarta akan tetap menjadi pusat bisnis dan ekonomi Indonesia.
4. Alasan utama pemindahan ibukota antara lain untuk mengurangi kepadatan penduduk di Jakarta dan menyeimbangkan pembangunan di Indonesia.

Jadi, saat ini Jakarta masih merupakan ibukota Indonesia, tetapi dalam beberapa tahun ke depan, ibukota akan berpindah ke Nusantara di Kalimantan Timur.

ChatCohere

Cohere adalah perusahaan AI terkemuka yang menyediakan solusi AI untuk perusahaan. Perusahaan ini mengembangkan model bahasa berskala besar (LLM), sehingga memudahkan bisnis untuk mengadopsi dan memanfaatkan teknologi AI.

Cohere adalah perusahaan rintisan yang menyediakan platform AI perusahaan dan didirikan pada tahun 2020.
Cohere baru-baru ini mengumpulkan $270 juta dalam putaran pendanaan Seri C, yang menunjukkan potensi pertumbuhan perusahaan.
Investor utama termasuk Inovia Capital, NVIDIA, Oracle, dan Salesforce Ventures.

Command R+

LLM terbaru dari Cohere, Command R+, adalah model yang dioptimalkan untuk perusahaan. Fitur utama:
Jendela konteks panjang dengan 128 ribu token
Fitur Pencarian Lanjutan Generasi yang Disempurnakan (RAG).
Mendukung 10 bahasa bisnis utama
Kemampuan untuk menggunakan alat untuk mengotomatisasi proses bisnis yang kompleks

Aya

Merupakan LLM multibahasa sumber terbuka yang dikembangkan oleh Cohere for AI (lembaga penelitian nirlaba Cohere).
Dapat mendukung 101 bahasa, lebih dari dua kali lipat model open source yang ada.
Juga merilis kumpulan data pelatihan multibahasa berskala besar yang berisi 513 juta titik data.

from langchain_cohere import ChatCohere

# Membuat objek ChatCohere.
cohere = ChatCohere(suhu=0)

# Gunakan stream() sebagai ganti dari invoke() untuk output streaming.
jawaban = cohere.stream("Apa itu cinta?")

# Keluarkan jawabannya
stream_response(jawaban)

ChatUpStage

Upstage adalah perusahaan rintisan Korea yang berspesialisasi dalam teknologi kecerdasan buatan (artificial intelligence/AI), khususnya di bidang model bahasa berskala besar (LLM) dan AI dokumen.

Produk dan teknologi unggulan

Solar LLM: Model bahasa berskala besar unggulan Upstage
Document AI Pack: Solusi pemrosesan dokumen berdasarkan teknologi OCR
AskUp Seargest: layanan pencarian dan rekomendasi yang dipersonalisasi, versi yang ditingkatkan dari chatbot gratis AskUp dengan integrasi ChatGPT.

Penerbitan kunci API

Dapatkan kunci API: https://console.upstage.ai/api-keys

from langchain_upstage import ChatUpstage

# Membuat objek ChatUpstage.
upstage = ChatUpstage()

# Gunakan stream() sebagai pengganti invoke() untuk output streaming.
answer = upstage.stream("Apa itu cinta?")

# Keluarkan jawabannya
stream_response(jawaban)

Xionic

Sionic AI adalah startup kecerdasan buatan yang menjanjikan dari Korea Selatan yang mengembangkan solusi AI generatif untuk perusahaan. Berikut adalah beberapa fakta penting tentang perusahaan ini

Produk unggulan

Platform STORM: Platform yang memungkinkan organisasi untuk menerapkan AI generatif tanpa masalah teknis
STORM Answer: Solusi AI generatif yang dioptimalkan untuk perusahaan yang bertujuan untuk meningkatkan produktivitas bisnis
Xionic: Model AI bahasa Korea dengan lisensi yang tersedia secara komersial Model bahasa Korea dengan lisensi yang tersedia secara komersial

Tautan: https://github.com/sionic-ai/xionic

from langchain_openai import ChatOpenAI

xionic = ChatOpenAI(
    model_name="xionic-1-72b-20240610",
    base_url="https://sionic.chat/v1/",
    api_key="934c4bbc-c384-4bea-af82-1450d7f8128d",
)

# Gunakan stream() sebagai pengganti invoke() untuk output streaming.
jawaban = xionic.stream("Apa itu cinta?")

# Keluarkan jawabannya
stream_response(jawaban)

LogicKor

LogicKor adalah papan peringkat tolok ukur yang dirancang untuk menilai kemampuan berpikir multidisiplin dalam model bahasa Korea.

Tujuan: Tolok ukur untuk mengukur kemampuan berpikir multidisiplin dalam model bahasa Korea.
Area penilaian: Penalaran bahasa Korea, matematika, menulis, pengkodean, pemahaman, dll.

Fitur utama

Mengevaluasi berbagai model: Membandingkan kinerja model bahasa yang berbeda dari dalam dan luar negeri
Pengukuran kinerja yang objektif: Memberikan indikator objektif dengan mengevaluasi kinerja aktual model dari berbagai sudut
Sumber terbuka: Platform terbuka yang dapat diakses oleh siapa saja dan memeriksa hasilnya

Papan Peringkat LogicKor menjadi alat penting untuk pengembangan model AI Korea, dan kami menantikan peningkatan dan pengembangannya yang berkelanjutan.

Tautan: https://lk.instruct.kr/

PreviousCH04 - Model Next02. Cache

Last updated 10 months ago