01. Manfaatkan berbagai model LLM yang berbeda
01. Memanfaatkan berbagai model LLM
OpenAI
OpenAi merupakan Model Bahasa Besar (Large Language Model, LLM) khusus obrolan dari OpenAI.
Ketika Anda membuat objek, Anda dapat menentukan nilai opsi berikut ini. Opsi-opsi tersebut dijelaskan secara rinci di bawah ini
temperature
Pilih temperature pengambilan sampel yang akan digunakan, antara 0 dan 2. Nilai yang lebih tinggi, seperti 0,8, membuat output lebih acak, sementara nilai yang lebih rendah, seperti 0,2, membuat output lebih terfokus dan deterministik.
max_tokens
Jumlah maksimum token yang akan dihasilkan dari penyelesaian obrolan.
model_name
: Model yang berlaku
spesifikasi model
Nama Model | Keterangan | Panjang Konteks | Data Pelatihan |
---|---|---|---|
gpt-4o | GPT-4o baru: Model andalan multi-mode terbaru yang lebih murah dan lebih cepat dibandingkan GPT-4 Turbo. | 128.000 token | Hingga Oktober 2023 |
gpt-4-turbo | Ini adalah model GPT-4 Turbo terbaru dan dilengkapi fitur penglihatan. Anda dapat menggunakan mode JSON dan panggilan fungsi. | 128.000 token | Hingga Desember 2023 |
gpt-4 | Ini adalah model GPT-4 terbaru. | 8.192 token | Hingga September 2021 |
gpt-3.5-turbo-0125 | Model GPT-3.5 Turbo terbaru, yang merespons lebih akurat sesuai format yang diminta dan mengatasi masalah pengkodean teks untuk panggilan fungsi non-bahasa Inggris. | 16.385 token | Hingga September 2021 |
gpt-3.5-turbo | Saat ini menunjuk ke gpt-3.5-turbo-0125. | 16.385 token | Hingga September 2021 |
ChatAnthropic
Anthropic adalah perusahaan rintisan asal Amerika yang berfokus pada keamanan dan penelitian kecerdasan buatan (AI). Berikut adalah beberapa fakta penting tentang Anthropic - Perusahaan AI yang didirikan pada tahun 2021 - Berkantor pusat di San Francisco, Amerika Serikat - Didirikan oleh mantan karyawan OpenAI (termasuk Daniela Amodei dan Dario Amodei) - Terdaftar sebagai Public Benefit Corporation
Claude
Rangkaian model bahasa skala besar (LLM) andalan Anthropic
Masalah kunci API: https://console.anthropic.com/settings/keys
Daftar model: https://docs.anthropic.com/en/docs/about-claude/models
Daftar model dari Anthropic
Nama Model | Model | API Antropik | Batuan Dasar AWS | GCP Vertex AI |
---|---|---|---|---|
Karya Claude 3.5 | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun |
Claude 3.5 Soneta | claude-3-5-soneta-20240620 | antropik.claude-3-5-soneta-20240620-v1:0 | c1aude-3-5-soneta@20240620 | claude-3-5-soneta@20240620 |
Claude 3.5 Haiku | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun |
Karya Claude 3 | claude-3-opus-20240229 | antropik.claude-3-opus-20240229-v1:0 | c1aude-3-opus@20240229 | claude-3-opus@20240229 |
Claude 3 Soneta | claude-3-soneta-20240229 | antropik.claude-3-soneta-20240229-v1:0 | c1aude-3-soneta@20240229 | claude-3-soneta@20240229 |
Claude 3 Haiku | claude-3-haiku-20240307 | antropik.claude-3-haiku-20240307-v1:0 | c1aude-3-haiku@20240307 | claude-3-haiku@20240307 |
ChatCohere
Cohere adalah perusahaan AI terkemuka yang menyediakan solusi AI untuk perusahaan. Perusahaan ini mengembangkan model bahasa berskala besar (LLM), sehingga memudahkan bisnis untuk mengadopsi dan memanfaatkan teknologi AI.
Cohere adalah perusahaan rintisan yang menyediakan platform AI perusahaan dan didirikan pada tahun 2020.
Cohere baru-baru ini mengumpulkan $270 juta dalam putaran pendanaan Seri C, yang menunjukkan potensi pertumbuhan perusahaan.
Investor utama termasuk Inovia Capital, NVIDIA, Oracle, dan Salesforce Ventures.
Command R+
LLM terbaru dari Cohere, Command R+, adalah model yang dioptimalkan untuk perusahaan. Fitur utama:
Jendela konteks panjang dengan 128 ribu token
Fitur Pencarian Lanjutan Generasi yang Disempurnakan (RAG).
Mendukung 10 bahasa bisnis utama
Kemampuan untuk menggunakan alat untuk mengotomatisasi proses bisnis yang kompleks
Aya
Merupakan LLM multibahasa sumber terbuka yang dikembangkan oleh Cohere for AI (lembaga penelitian nirlaba Cohere).
Dapat mendukung 101 bahasa, lebih dari dua kali lipat model open source yang ada.
Juga merilis kumpulan data pelatihan multibahasa berskala besar yang berisi 513 juta titik data.
ChatUpStage
Upstage adalah perusahaan rintisan Korea yang berspesialisasi dalam teknologi kecerdasan buatan (artificial intelligence/AI), khususnya di bidang model bahasa berskala besar (LLM) dan AI dokumen.
Produk dan teknologi unggulan
Solar LLM: Model bahasa berskala besar unggulan Upstage
Document AI Pack: Solusi pemrosesan dokumen berdasarkan teknologi OCR
AskUp Seargest: layanan pencarian dan rekomendasi yang dipersonalisasi, versi yang ditingkatkan dari chatbot gratis AskUp dengan integrasi ChatGPT.
Penerbitan kunci API
Dapatkan kunci API: https://console.upstage.ai/api-keys
Xionic
Sionic AI adalah startup kecerdasan buatan yang menjanjikan dari Korea Selatan yang mengembangkan solusi AI generatif untuk perusahaan. Berikut adalah beberapa fakta penting tentang perusahaan ini
Produk unggulan
Platform STORM: Platform yang memungkinkan organisasi untuk menerapkan AI generatif tanpa masalah teknis
STORM Answer: Solusi AI generatif yang dioptimalkan untuk perusahaan yang bertujuan untuk meningkatkan produktivitas bisnis
Xionic: Model AI bahasa Korea dengan lisensi yang tersedia secara komersial Model bahasa Korea dengan lisensi yang tersedia secara komersial
Tautan: https://github.com/sionic-ai/xionic
LogicKor
LogicKor adalah papan peringkat tolok ukur yang dirancang untuk menilai kemampuan berpikir multidisiplin dalam model bahasa Korea.
Tujuan: Tolok ukur untuk mengukur kemampuan berpikir multidisiplin dalam model bahasa Korea.
Area penilaian: Penalaran bahasa Korea, matematika, menulis, pengkodean, pemahaman, dll.
Fitur utama
Mengevaluasi berbagai model: Membandingkan kinerja model bahasa yang berbeda dari dalam dan luar negeri
Pengukuran kinerja yang objektif: Memberikan indikator objektif dengan mengevaluasi kinerja aktual model dari berbagai sudut
Sumber terbuka: Platform terbuka yang dapat diakses oleh siapa saja dan memeriksa hasilnya
Papan Peringkat LogicKor menjadi alat penting untuk pengembangan model AI Korea, dan kami menantikan peningkatan dan pengembangannya yang berkelanjutan.
Tautan: https://lk.instruct.kr/
Last updated