Seiring aplikasi AI memasuki berbagai industri, penilaian yang akurat terhadap kinerja model dan peningkatan kepercayaan pengguna telah menjadi isu mendesak. Evaluasi tradisional sering kali bergantung pada mekanisme terpusat, menyulitkan untuk mencakup berbagai skenario dan gagal mencerminkan preferensi pengguna yang sebenarnya; pada saat yang sama, masalah "halusinasi" model sering muncul, menyebabkan pengguna sering terjebak dalam silo informasi saat membuat pilihan.
Dalam konteks ini, Yupp, sebagai platform baru, berusaha untuk membentuk kembali penemuan, perbandingan, dan pemanfaatan model AI dengan model crowdsourcing dan mekanisme insentif yang unik, membawa perubahan paradigma ke bidang evaluasi AI. Artikel ini akan membahas mekanisme inti Yupp, sorotan teknis, latar belakang tim, dan dampak potensialnya pada ekosistem AI.
Yupp berfokus pada penyelesaian tantangan evaluasi yang telah ada lama di bidang AI, didedikasikan untuk membangun pasar umpan balik AI yang "trustless"—memungkinkan umpan balik pengguna yang beragam untuk beredar secara bebas di bawah perlindungan blockchain dan insentif ekonomi-kripto, sehingga membentuk lapisan evaluasi model yang skalabel, adil, dan transparan. Dengan memberikan insentif untuk distribusi data yang diannotasi secara manual berkualitas tinggi, Yupp dapat dengan cepat menangkap kebutuhan dan preferensi nyata pengguna dalam berbagai skenario, membantu pengembang AI mengoptimalkan kinerja model secara iteratif.
Proyek ini didirikan pada Juni 2024 oleh Pankaj Gupta (Co-founder dan CEO) dan Gilad Mishne (Co-founder dan Kepala AI), dengan Ilmuwan Utama Jimmy Lin (Profesor di Universitas Waterloo) juga berpartisipasi dalam tim inti. Ketiganya sebelumnya bekerja sama di Twitter pada tahun 2010, di mana mereka membangun dan mengoptimalkan sistem rekomendasi dan pencarian berskala besar, dan kemudian mendapatkan pengalaman luas di Google dan Coinbase.
Karena visinya tentang desentralisasi dan transparansi nilai data, yang dapat memenuhi dua permintaan produsen AI untuk evaluasi yang kredibel dan partisipasi pengguna, serta memanfaatkan pengalaman kaya dari tim intinya, Yupp telah memperoleh pengakuan tinggi dari tokoh-tokoh terkenal di industri teknologi dan modal ventura terkemuka.
Minggu lalu, Yupp mengumumkan penyelesaian pendanaan putaran benih sebesar $33 juta, yang dipimpin oleh mitra A16z Chris Dixon. Investor lainnya termasuk Kepala Ilmuwan Google Jeff Dean, salah satu pendiri Twitter Biz Stone, salah satu pendiri Pinterest Evan Sharp, CEO Perplexity Aravind Srinivas, Dan Boneh dari Universitas Stanford, Chris Re, Nick McKeown, dan Balaji Prabhakar, di antara 45 malaikat dan eksekutif korporat terkenal, serta Coinbase Ventures.
Sebagai platform evaluasi AI terpusat, Yupp menganut filosofi “Setiap AI untuk semua,” memungkinkan pengguna untuk dengan mudah menemukan, membandingkan, dan memanfaatkan model AI terbaru. Berbeda dengan respons tunggal tradisional, Yupp mengembalikan jawaban dari dua (atau bahkan lebih) model secara bersamaan untuk setiap permintaan, membentuk “parlemen AI.” Desain ini tidak hanya memenuhi permintaan pengguna akan pilihan yang beragam tetapi juga secara efektif mengidentifikasi potensi “halusinasi” yang mungkin dihasilkan oleh model, membantu pengguna membuat keputusan yang lebih terinformasi melalui perbandingan. Seperti yang dinyatakan oleh CEO Yupp Pankaj Gupta, keluaran berdampingan sangat bermanfaat bagi pengguna yang khawatir tentang kesalahan generasi, karena mereka dapat memverifikasi hasil secara silang.
Platform ini sekarang mendukung lebih dari 500 model AI, mencakup bidang generasi teks dan gambar, termasuk model-model terkenal seperti ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama, dan banyak model baru yang muncul. Untuk lebih mengoptimalkan pengalaman, Yupp juga telah meluncurkan fitur "QuickTake", yang dapat meringkas balasan yang panjang menjadi sebuah tweet yang ringkas.
Selain itu, Yupp memberikan prioritas tinggi pada privasi pengguna: semua catatan chat bersifat pribadi secara default kecuali pengguna secara aktif menjadikannya publik; bahkan ketika dibagikan secara publik, tidak ada informasi pribadi yang diungkapkan. Pengguna dapat mengontrol konten dan cakupan pembagian kapan saja.
Yupp akan menggunakan umpan balik pengguna secara gratis dan mengukur penggunaan model melalui sistem "Yupp Points". Pengguna baru menerima 5000 poin saat pendaftaran, dan dapat memperoleh lebih banyak poin dengan menilai respons model, memilih preferensi, dan menjelaskan alasan mereka. Semakin tinggi kualitas umpan balik, semakin besar hadiahnya, memastikan pengguna dapat secara berkelanjutan menggunakan model kelas atas seperti Claude Opus 4 atau OpenAI o3 secara gratis. Platform ini menjanjikan bahwa poin hanya akan meningkat dan bahwa semua model saat ini dapat diperoleh secara gratis.
Setelah setiap pertanyaan, pengguna akan menerima dua respons model dan dapat memperoleh "kartu gores digital" melalui umpan balik, yang memberikan poin Yupp berkisar antara 0 hingga 250. Setiap 1000 poin dapat ditukarkan dengan 1 dolar, dengan penarikan maksimum harian 10 dolar dan maksimum bulanan 50 dolar. Poin dapat ditukarkan untuk lebih dari 20 mata uang, termasuk dolar dan euro, dengan mitra termasuk Stripe, PayPal, dan Coinbase. Pada saat yang sama, platform mengintegrasikan Base Ethernet L2 dan stablecoin Solana untuk memberikan pengguna global dengan hadiah instan tanpa biaya.
Seperti yang dikatakan Pankaj Gupta, umpan balik berkualitas tinggi yang dihasilkan oleh pengguna jauh lebih berharga bagi penyempurnaan model dan pembelajaran penguatan perusahaan AI daripada imbalan itu sendiri. Meskipun penghasilan bulanan pengguna mungkin hanya setara dengan beberapa cangkir kopi, data anotasi berbayar ini sangat penting untuk iterasi AI.
Untuk mendorong lebih banyak orang untuk berpartisipasi, Yupp juga menetapkan hadiah rujukan: orang yang merujuk menerima 5000 poin, dan orang yang dirujuk menerima 1000 poin; saat ini, pengguna yang terdaftar baru dapat menerima 5000 poin, dan orang yang dirujuk tambahan menerima 2500 poin.
Untuk mengatasi masalah yang ada terkait kurangnya transparansi dalam peringkat, kurangnya keadilan, dan akses yang tidak merata terhadap data evaluasi, Yupp telah meluncurkan versi beta dari peringkat AI dan sistem penilaian “Yupp VIBE (Vibe Intelligence Benchmark) Score”. Sistem ini mengumpulkan data preferensi yang dihasilkan oleh pengguna global dalam interaksi alami, dengan tujuan memberikan hasil evaluasi yang kuat dan dapat diandalkan.
Prinsip evaluasi Yupp meliputi:
Platform ini tidak hanya mengumpulkan preferensi biner tetapi juga mendorong pengguna untuk menunjukkan kelebihan dan kekurangan dari balasan (seperti "tepat sasaran", "kecepatan tinggi", "gaya yang baik", dll.), dan melakukan analisis kluster berdasarkan usia pengguna, pendidikan, pekerjaan, dan informasi lainnya untuk menunjukkan perbedaan preferensi di antara berbagai kelompok.
Pada tingkat teknis, Yupp sedang mengeksplorasi penggunaan Blockchain, primitif kriptografi, dan bukti nol-pengetahuan untuk memastikan bahwa proses evaluasi adil, transparan, dan dapat diverifikasi. Pada saat yang sama, platform ini telah bermitra dengan penyedia data AI profesional untuk mengkalibrasi penilai melalui verifikasi arsip dan deteksi kualitas multi-lapisan untuk menghilangkan data jahat.
Papan peringkat terbaru telah diperbarui, menampilkan skor VIBE dari model-model seperti GPT‑4.5 Preview, Claude Opus 4, dan Claude Sonnet 4, bersama dengan tingkat kemenangan, tingkat ketidak sukaan, kecepatan, latensi, jendela konteks, dan metrik biaya mereka.
Yupp resmi diluncurkan pada 13 Juni 2025, setelah enam bulan pengujian internal. Sejak peluncurannya, produk ini terus beriterasi:
Misi Yupp adalah "memberdayakan umat manusia untuk membentuk masa depan AI." Pankaj Gupta percaya bahwa pengembangan AI memerlukan partisipasi dan kontribusi dari semua orang. Melalui respons AI yang multi-perspektif dan umpan balik pengguna, Yupp tidak hanya membantu pengguna membuat keputusan yang lebih baik tetapi juga memberikan dorongan yang berkelanjutan untuk evolusi AI.
Perlu disebutkan bahwa salah satu pesaing utama Yupp adalah platform evaluasi model AI terbuka LMArena (situs web:https://lmarena.ai/),Situs web ini sangat populer di kalangan profesional AI, tetapi platform saat ini berada dalam tahap eksplorasi komersial dan tidak menyediakan imbalan material langsung atau mekanisme insentif poin untuk partisipasi pengguna dengan memanfaatkan teknologi Blockchain.
Secara keseluruhan, Yupp telah membuka jalur baru untuk penilaian AI dengan model yang didorong oleh kerumunan, mekanisme insentif, dan sistem evaluasi yang dipimpin oleh preferensi pengguna nyata. Ini tidak hanya menawarkan pengalaman interaktif AI yang gratis dan beragam kepada pengguna tetapi juga mengubah umpan balik pengguna menjadi data pelatihan bernilai tinggi, mendorong optimisasi terus-menerus dari model. Dengan tim yang berpengalaman dan dukungan modal kelas atas, Yupp diharapkan memainkan peran kunci dalam ekosistem AI masa depan, mewujudkan visi "AI untuk semua, dibentuk oleh semua."
Namun, untuk Yupp, yang baru diluncurkan, bagaimana cara terus memastikan kualitas data, menahan potensi perilaku kecurangan di bawah partisipasi sejumlah besar pengguna, dan mencapai keseimbangan antara komersialisasi dan insentif pengguna akan tetap menjadi arah yang perlu dieksplorasi dan dioptimalkan dalam pengembangan masa depannya.
Seiring aplikasi AI memasuki berbagai industri, penilaian yang akurat terhadap kinerja model dan peningkatan kepercayaan pengguna telah menjadi isu mendesak. Evaluasi tradisional sering kali bergantung pada mekanisme terpusat, menyulitkan untuk mencakup berbagai skenario dan gagal mencerminkan preferensi pengguna yang sebenarnya; pada saat yang sama, masalah "halusinasi" model sering muncul, menyebabkan pengguna sering terjebak dalam silo informasi saat membuat pilihan.
Dalam konteks ini, Yupp, sebagai platform baru, berusaha untuk membentuk kembali penemuan, perbandingan, dan pemanfaatan model AI dengan model crowdsourcing dan mekanisme insentif yang unik, membawa perubahan paradigma ke bidang evaluasi AI. Artikel ini akan membahas mekanisme inti Yupp, sorotan teknis, latar belakang tim, dan dampak potensialnya pada ekosistem AI.
Yupp berfokus pada penyelesaian tantangan evaluasi yang telah ada lama di bidang AI, didedikasikan untuk membangun pasar umpan balik AI yang "trustless"—memungkinkan umpan balik pengguna yang beragam untuk beredar secara bebas di bawah perlindungan blockchain dan insentif ekonomi-kripto, sehingga membentuk lapisan evaluasi model yang skalabel, adil, dan transparan. Dengan memberikan insentif untuk distribusi data yang diannotasi secara manual berkualitas tinggi, Yupp dapat dengan cepat menangkap kebutuhan dan preferensi nyata pengguna dalam berbagai skenario, membantu pengembang AI mengoptimalkan kinerja model secara iteratif.
Proyek ini didirikan pada Juni 2024 oleh Pankaj Gupta (Co-founder dan CEO) dan Gilad Mishne (Co-founder dan Kepala AI), dengan Ilmuwan Utama Jimmy Lin (Profesor di Universitas Waterloo) juga berpartisipasi dalam tim inti. Ketiganya sebelumnya bekerja sama di Twitter pada tahun 2010, di mana mereka membangun dan mengoptimalkan sistem rekomendasi dan pencarian berskala besar, dan kemudian mendapatkan pengalaman luas di Google dan Coinbase.
Karena visinya tentang desentralisasi dan transparansi nilai data, yang dapat memenuhi dua permintaan produsen AI untuk evaluasi yang kredibel dan partisipasi pengguna, serta memanfaatkan pengalaman kaya dari tim intinya, Yupp telah memperoleh pengakuan tinggi dari tokoh-tokoh terkenal di industri teknologi dan modal ventura terkemuka.
Minggu lalu, Yupp mengumumkan penyelesaian pendanaan putaran benih sebesar $33 juta, yang dipimpin oleh mitra A16z Chris Dixon. Investor lainnya termasuk Kepala Ilmuwan Google Jeff Dean, salah satu pendiri Twitter Biz Stone, salah satu pendiri Pinterest Evan Sharp, CEO Perplexity Aravind Srinivas, Dan Boneh dari Universitas Stanford, Chris Re, Nick McKeown, dan Balaji Prabhakar, di antara 45 malaikat dan eksekutif korporat terkenal, serta Coinbase Ventures.
Sebagai platform evaluasi AI terpusat, Yupp menganut filosofi “Setiap AI untuk semua,” memungkinkan pengguna untuk dengan mudah menemukan, membandingkan, dan memanfaatkan model AI terbaru. Berbeda dengan respons tunggal tradisional, Yupp mengembalikan jawaban dari dua (atau bahkan lebih) model secara bersamaan untuk setiap permintaan, membentuk “parlemen AI.” Desain ini tidak hanya memenuhi permintaan pengguna akan pilihan yang beragam tetapi juga secara efektif mengidentifikasi potensi “halusinasi” yang mungkin dihasilkan oleh model, membantu pengguna membuat keputusan yang lebih terinformasi melalui perbandingan. Seperti yang dinyatakan oleh CEO Yupp Pankaj Gupta, keluaran berdampingan sangat bermanfaat bagi pengguna yang khawatir tentang kesalahan generasi, karena mereka dapat memverifikasi hasil secara silang.
Platform ini sekarang mendukung lebih dari 500 model AI, mencakup bidang generasi teks dan gambar, termasuk model-model terkenal seperti ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama, dan banyak model baru yang muncul. Untuk lebih mengoptimalkan pengalaman, Yupp juga telah meluncurkan fitur "QuickTake", yang dapat meringkas balasan yang panjang menjadi sebuah tweet yang ringkas.
Selain itu, Yupp memberikan prioritas tinggi pada privasi pengguna: semua catatan chat bersifat pribadi secara default kecuali pengguna secara aktif menjadikannya publik; bahkan ketika dibagikan secara publik, tidak ada informasi pribadi yang diungkapkan. Pengguna dapat mengontrol konten dan cakupan pembagian kapan saja.
Yupp akan menggunakan umpan balik pengguna secara gratis dan mengukur penggunaan model melalui sistem "Yupp Points". Pengguna baru menerima 5000 poin saat pendaftaran, dan dapat memperoleh lebih banyak poin dengan menilai respons model, memilih preferensi, dan menjelaskan alasan mereka. Semakin tinggi kualitas umpan balik, semakin besar hadiahnya, memastikan pengguna dapat secara berkelanjutan menggunakan model kelas atas seperti Claude Opus 4 atau OpenAI o3 secara gratis. Platform ini menjanjikan bahwa poin hanya akan meningkat dan bahwa semua model saat ini dapat diperoleh secara gratis.
Setelah setiap pertanyaan, pengguna akan menerima dua respons model dan dapat memperoleh "kartu gores digital" melalui umpan balik, yang memberikan poin Yupp berkisar antara 0 hingga 250. Setiap 1000 poin dapat ditukarkan dengan 1 dolar, dengan penarikan maksimum harian 10 dolar dan maksimum bulanan 50 dolar. Poin dapat ditukarkan untuk lebih dari 20 mata uang, termasuk dolar dan euro, dengan mitra termasuk Stripe, PayPal, dan Coinbase. Pada saat yang sama, platform mengintegrasikan Base Ethernet L2 dan stablecoin Solana untuk memberikan pengguna global dengan hadiah instan tanpa biaya.
Seperti yang dikatakan Pankaj Gupta, umpan balik berkualitas tinggi yang dihasilkan oleh pengguna jauh lebih berharga bagi penyempurnaan model dan pembelajaran penguatan perusahaan AI daripada imbalan itu sendiri. Meskipun penghasilan bulanan pengguna mungkin hanya setara dengan beberapa cangkir kopi, data anotasi berbayar ini sangat penting untuk iterasi AI.
Untuk mendorong lebih banyak orang untuk berpartisipasi, Yupp juga menetapkan hadiah rujukan: orang yang merujuk menerima 5000 poin, dan orang yang dirujuk menerima 1000 poin; saat ini, pengguna yang terdaftar baru dapat menerima 5000 poin, dan orang yang dirujuk tambahan menerima 2500 poin.
Untuk mengatasi masalah yang ada terkait kurangnya transparansi dalam peringkat, kurangnya keadilan, dan akses yang tidak merata terhadap data evaluasi, Yupp telah meluncurkan versi beta dari peringkat AI dan sistem penilaian “Yupp VIBE (Vibe Intelligence Benchmark) Score”. Sistem ini mengumpulkan data preferensi yang dihasilkan oleh pengguna global dalam interaksi alami, dengan tujuan memberikan hasil evaluasi yang kuat dan dapat diandalkan.
Prinsip evaluasi Yupp meliputi:
Platform ini tidak hanya mengumpulkan preferensi biner tetapi juga mendorong pengguna untuk menunjukkan kelebihan dan kekurangan dari balasan (seperti "tepat sasaran", "kecepatan tinggi", "gaya yang baik", dll.), dan melakukan analisis kluster berdasarkan usia pengguna, pendidikan, pekerjaan, dan informasi lainnya untuk menunjukkan perbedaan preferensi di antara berbagai kelompok.
Pada tingkat teknis, Yupp sedang mengeksplorasi penggunaan Blockchain, primitif kriptografi, dan bukti nol-pengetahuan untuk memastikan bahwa proses evaluasi adil, transparan, dan dapat diverifikasi. Pada saat yang sama, platform ini telah bermitra dengan penyedia data AI profesional untuk mengkalibrasi penilai melalui verifikasi arsip dan deteksi kualitas multi-lapisan untuk menghilangkan data jahat.
Papan peringkat terbaru telah diperbarui, menampilkan skor VIBE dari model-model seperti GPT‑4.5 Preview, Claude Opus 4, dan Claude Sonnet 4, bersama dengan tingkat kemenangan, tingkat ketidak sukaan, kecepatan, latensi, jendela konteks, dan metrik biaya mereka.
Yupp resmi diluncurkan pada 13 Juni 2025, setelah enam bulan pengujian internal. Sejak peluncurannya, produk ini terus beriterasi:
Misi Yupp adalah "memberdayakan umat manusia untuk membentuk masa depan AI." Pankaj Gupta percaya bahwa pengembangan AI memerlukan partisipasi dan kontribusi dari semua orang. Melalui respons AI yang multi-perspektif dan umpan balik pengguna, Yupp tidak hanya membantu pengguna membuat keputusan yang lebih baik tetapi juga memberikan dorongan yang berkelanjutan untuk evolusi AI.
Perlu disebutkan bahwa salah satu pesaing utama Yupp adalah platform evaluasi model AI terbuka LMArena (situs web:https://lmarena.ai/),Situs web ini sangat populer di kalangan profesional AI, tetapi platform saat ini berada dalam tahap eksplorasi komersial dan tidak menyediakan imbalan material langsung atau mekanisme insentif poin untuk partisipasi pengguna dengan memanfaatkan teknologi Blockchain.
Secara keseluruhan, Yupp telah membuka jalur baru untuk penilaian AI dengan model yang didorong oleh kerumunan, mekanisme insentif, dan sistem evaluasi yang dipimpin oleh preferensi pengguna nyata. Ini tidak hanya menawarkan pengalaman interaktif AI yang gratis dan beragam kepada pengguna tetapi juga mengubah umpan balik pengguna menjadi data pelatihan bernilai tinggi, mendorong optimisasi terus-menerus dari model. Dengan tim yang berpengalaman dan dukungan modal kelas atas, Yupp diharapkan memainkan peran kunci dalam ekosistem AI masa depan, mewujudkan visi "AI untuk semua, dibentuk oleh semua."
Namun, untuk Yupp, yang baru diluncurkan, bagaimana cara terus memastikan kualitas data, menahan potensi perilaku kecurangan di bawah partisipasi sejumlah besar pengguna, dan mencapai keseimbangan antara komersialisasi dan insentif pengguna akan tetap menjadi arah yang perlu dieksplorasi dan dioptimalkan dalam pengembangan masa depannya.