Anda mungkin sudah melihat beberapa hal luar biasa yang telah dibuktikan oleh AI — menghasilkan teks dalam sekejap, memberikan beberapa tip mode kepada Paus, membuat video apa pun, atau memberikan kode yang berguna bagi pemrogram dan non-pemrogram. Namun AI tidak belajar melakukan semua hal ini begitu saja. Setiap alat AI telah dilatih pada data yang berbeda, menciptakan apa yang disebut model dasar.
Sederhananya, seorang dokter akan bersekolah di sekolah kedokteran dan melatih prosedur medis. Bagi seorang dokter AI, latar belakang tersebut akan menjadi model dasar mereka. Jika Anda menginginkan Karate AI, data pelatihan untuk dokter tidak akan ada gunanya. Sebaliknya, mereka akan melatih teknik seni bela diri untuk menciptakan model dasarnya. Model dasar adalah hasil dari sejumlah besar data dan banyak pembelajaran mesin yang dilakukan pada data tersebut.
Untuk AI di dunia nyata, model dasar biasanya terdiri dari data yang lebih mudah dimasukkan ke dalam komputer dibandingkan teknik medis atau tendangan lokomotif. Bahasa merupakan hal yang umum, dengan sejumlah besar teks yang dimasukkan ke dalam pelatihan AI untuk menghasilkan model dasar. Selain teks, bahasa pemrograman juga dapat digunakan untuk membangun model dasar yang mahir dalam coding. Citra dan suara juga populer untuk model dasar, sehingga memungkinkan terciptanya alat AI yang dapat membuat gambar baru, mengenali atau menghasilkan ucapan, atau membuat musik baru.
Membuat model pondasi bukanlah hal yang mudah. Selain banyaknya data yang perlu dipelajari AI, diperlukan daya komputasi yang sangat besar untuk menangani pembelajaran mesin yang menggunakan data tersebut. Hal inilah yang menjadikan model dasar begitu penting, karena membangun model baru untuk setiap penerapan AI baru akan menjadi tidak efisien. Sebaliknya, model pondasi yang populer dan kuat dapat disesuaikan dengan aplikasi yang berbeda.
Anda mungkin pernah mendengar beberapa model pondasi dan mungkin tidak menyadari bahwa model tersebut memang demikian. Difusi Stabil adalah model dasar di balik banyak citra tren yang dihasilkan AI, dan telah diperluas ke sejumlah model berbeda, termasuk Stable Diffusion XL, Stable Diffusion XL (SDXL) Stability AI, SDXL Turbo.
Untuk teks, Gemma, Mistral, dan Llama 2 adalah beberapa model alas bedak paling populer. Beberapa model, seperti Kosmos 2, bersifat multi-model dan dapat memproses berbagai jenis data, sehingga memungkinkan mereka memahami gambar dan teks.
Model dasar mungkin terdengar jauh dari jangkauan pengguna, namun sebenarnya model ini dapat diakses dengan diperkenalkannya lebih banyak PC AI yang mampu menjalankan model ini dengan perangkat keras khusus. GPU RTX NVIDIA memiliki perangkat keras seperti itu, dengan Tensor Cores yang dirancang khusus untuk mempercepat kinerja AI.
Melalui aplikasi ChatRTX NVIDIA, Anda dapat dengan mudah menjalankan model dasar Mistral dan Llama 2 pada PC Windows dan laptop dengan perangkat keras NVIDIA RTX di dalamnya. Dengan retrieval-augmented generation (RAG), Anda bahkan dapat memasukkan sebagian data Anda ke dalam model bahasa besar, sehingga dapat memberikan jawaban yang relevan. Misalnya, Anda dapat memberinya catatan untuk novel fiksi ilmiah yang Anda tulis, dan menanyakan detailnya kapan pun Anda lupa. Responsnya cepat karena model dijalankan secara lokal tanpa latensi yang timbul dari pengirimannya untuk pemrosesan cloud, dan dengan cara yang sama, data Anda lebih aman karena tidak harus dikirim dari mesin Anda juga.
Dengan pemahaman tentang model dasar, Anda akan lebih mampu menemukan alat yang tepat untuk pekerjaan Anda saat mencari aplikasi AI untuk membantu Anda. Untuk informasi lebih lanjut tentang perkembangan terkini AI dan penjelasan yang mudah dipahami, lihat Seri blog AI Decoded dari NVIDIA dengan pembaruan mingguan dan tips tentang alat AI yang dapat Anda lihat cara kerjanya.