Reliant Paper Finder AI Melawan Kebosanan Ilmu Data

- Redaksi

Selasa, 20 Agustus 2024

facebook twitter whatsapp telegram line copy

URL berhasil dicopy

facebook icon twitter icon whatsapp icon telegram icon line icon copy

URL berhasil dicopy

Model AI telah terbukti mampu melakukan banyak hal, tetapi tugas apa yang sebenarnya kita inginkan untuk dilakukan oleh mereka? Pekerjaan yang membosankan lebih disukai — dan banyak pekerjaan seperti itu dalam penelitian dan akademis. Reliant berharap untuk mengkhususkan diri dalam jenis pekerjaan ekstraksi data yang memakan waktu yang saat ini menjadi tugas mahasiswa pascasarjana dan pekerja magang yang lelah.

“Hal terbaik yang dapat Anda lakukan dengan AI adalah meningkatkan pengalaman manusia: kurangi pekerjaan kasar dan biarkan orang melakukan hal-hal yang penting bagi mereka,” kata CEO Karl Moritz. Dalam dunia penelitian, tempat ia dan para pendiri Marc Bellemare dan Richard Schlegel telah bekerja selama bertahun-tahun, tinjauan pustaka adalah salah satu contoh paling umum dari “pekerjaan kasar” ini.

IKLAN

GULIR UNTUK MELANJUTKAN KONTEN

Setiap makalah mengutip karya sebelumnya dan yang terkait, tetapi menemukan sumber-sumber ini di lautan ilmu pengetahuan tidaklah mudah. ​​Dan beberapa, seperti tinjauan sistematis, mengutip atau menggunakan data dari ribuan.

Untuk satu studi, Moritz mengenang, “Para penulis harus membaca 3.500 publikasi ilmiah, dan banyak di antaranya ternyata tidak relevan. Butuh banyak waktu untuk mengekstrak sejumlah kecil informasi yang berguna — rasanya seperti sesuatu yang seharusnya diotomatisasi oleh AI.”

Mereka tahu bahwa model bahasa modern dapat melakukannya: satu percobaan menggunakan ChatGPT dan menemukan bahwa model tersebut dapat mengekstrak data dengan tingkat kesalahan 11%. Seperti banyak hal yang dapat dilakukan LLM, hasilnya mengesankan tetapi bukan yang sebenarnya dibutuhkan orang.

Kredit Gambar: AI yang andal

“Itu saja tidak cukup baik,” kata Moritz. “Untuk tugas pengetahuan ini, meskipun sepele, sangat penting bagi Anda untuk tidak membuat kesalahan.”

Produk inti Reliant, Tabular, sebagian didasarkan pada LLM (LLaMa 3.1), tetapi jika digabungkan dengan teknik milik sendiri lainnya, hasilnya jauh lebih efektif. Pada ekstraksi multi-ribuan studi di atas, mereka mengatakan bahwa produk tersebut melakukan tugas yang sama dengan nol kesalahan.

Artinya: Anda memasukkan ribuan dokumen, katakanlah Anda menginginkan ini, itu, dan data lain dari dokumen tersebut, dan Reliant menelusurinya dan menemukan informasi tersebut — baik yang diberi label dan terstruktur dengan sempurna atau (kemungkinan besar) tidak. Kemudian, Reliant menampilkan semua data dan analisis yang ingin Anda lakukan ke dalam UI yang bagus sehingga Anda dapat menyelami kasus-kasus individual.

“Pengguna kami harus dapat bekerja dengan semua data sekaligus, dan kami tengah membangun fitur yang memungkinkan mereka mengedit data yang ada, atau berpindah dari data ke literatur; kami melihat peran kami sebagai membantu pengguna menemukan di mana mereka dapat memfokuskan perhatian mereka,” kata Moritz.

Penyaringan Literatur Pubmed Tabular Reliant Berdasarkan Pertanyaan Kompleks
Reliant Paper Finder AI Melawan Kebosanan Data Sains 9

Penerapan AI yang disesuaikan dan efektif ini — tidak terlalu mencolok dibandingkan dengan penerapan digitalnya tetapi hampir pasti lebih layak — dapat mempercepat sains dalam sejumlah domain yang sangat teknis. Para investor telah memperhatikannya, dengan mendanai putaran awal senilai $11,3 juta; Tola Capital dan Inovia Capital memimpin putaran tersebut, dengan partisipasi dari investor malaikat Mike Volpi.

Seperti aplikasi AI lainnya, teknologi Reliant sangat bergantung pada komputasi, itulah sebabnya perusahaan membeli perangkat kerasnya sendiri daripada menyewanya secara terpisah dari salah satu vendor besar. Menggunakan perangkat keras internal menawarkan risiko dan keuntungan: Anda harus membuat mesin mahal ini menguntungkan, tetapi Anda mendapatkan kesempatan untuk memecahkan masalah dengan komputasi khusus.

“Satu hal yang kami temukan adalah sangat sulit untuk memberikan jawaban yang baik jika Anda memiliki waktu yang terbatas untuk memberikannya,” jelas Moritz — misalnya, jika seorang ilmuwan meminta sistem untuk melakukan tugas ekstraksi atau analisis baru pada seratus makalah. Sistem dapat melakukannya dengan cepat, atau dapat melakukannya dengan baik, tetapi tidak keduanya — kecuali jika sistem memprediksi apa yang diinginkan pengguna. Mungkin bertanya dan mencari tahu jawabannya, atau sesuatu yang serupa, sebelumnya.

“Masalahnya, banyak orang punya pertanyaan yang sama, jadi kami bisa menemukan jawabannya sebelum mereka menanyakannya, sebagai titik awal,” kata Bellemare, kepala bagian sains perusahaan rintisan tersebut. “Kami bisa menyaring 100 halaman teks menjadi sesuatu yang lain, yang mungkin tidak persis seperti yang Anda inginkan, tetapi lebih mudah bagi kami untuk mengerjakannya.”

Pikirkan seperti ini: jika Anda akan mengekstrak makna dari seribu novel, apakah Anda akan menunggu sampai seseorang menanyakan nama-nama karakter untuk menelusuri dan mengambilnya? Atau apakah Anda akan melakukan pekerjaan itu sebelumnya (bersama dengan hal-hal seperti lokasi, tanggal, hubungan, dll.) dengan mengetahui bahwa data tersebut kemungkinan besar akan dibutuhkan? Yang terakhir, tentu saja — jika Anda memiliki komputer cadangan.

Pra-ekstraksi ini juga memberi waktu bagi model untuk menyelesaikan ambiguitas dan asumsi yang tak terelakkan yang ditemukan dalam berbagai domain ilmiah. Ketika satu metrik “menunjukkan” metrik lain, metrik tersebut mungkin tidak memiliki arti yang sama dalam bidang farmasi seperti dalam patologi atau uji klinis. Tidak hanya itu, model bahasa cenderung menghasilkan hasil yang berbeda, tergantung pada bagaimana pertanyaan tertentu diajukan. Jadi, tugas Reliant adalah mengubah ambiguitas menjadi kepastian — “dan itu adalah sesuatu yang hanya dapat Anda lakukan jika Anda bersedia berinvestasi dalam sains atau domain tersebut,” kata Moritz.

Sebagai sebuah perusahaan, fokus utama Reliant adalah memastikan bahwa teknologinya dapat membiayai dirinya sendiri sebelum mencoba sesuatu yang lebih ambisius. “Untuk membuat kemajuan yang menarik, Anda harus memiliki visi yang besar, tetapi Anda juga perlu memulai dengan sesuatu yang konkret,” kata Moritz. “Dari sudut pandang kelayakan perusahaan rintisan, kami berfokus pada perusahaan yang mencari laba, karena mereka memberi kami uang untuk membayar GPU kami. Kami tidak menjualnya dengan kerugian kepada pelanggan.”

Seseorang mungkin menduga perusahaan akan merasakan tekanan dari perusahaan seperti OpenAI dan Anthropic, yang menggelontorkan uang untuk tugas yang lebih terstruktur seperti manajemen basis data dan pengodean, atau dari mitra implementasi seperti Cohere dan Scale. Namun Bellemare optimis: “Kami membangun ini dengan dukungan penuh — setiap peningkatan dalam tumpukan teknologi kami sangat bagus bagi kami. LLM adalah salah satu dari sekitar delapan model pembelajaran mesin besar di luar sana — yang lainnya sepenuhnya milik kami, dibangun dari awal berdasarkan data kami.”

Transformasi industri bioteknologi dan penelitian menjadi industri yang digerakkan oleh AI tentu saja baru saja dimulai, dan kemungkinan akan berlangsung tidak merata selama beberapa tahun ke depan. Namun, Reliant tampaknya telah menemukan landasan yang kokoh untuk memulai.

“Jika Anda menginginkan solusi 95%, dan Anda hanya perlu meminta maaf kepada salah satu pelanggan Anda sesekali, bagus,” kata Moritz. “Kami mengutamakan keakuratan dan mengingat kembali, serta kesalahan. Dan sejujurnya, itu sudah cukup, kami senang menyerahkan sisanya kepada orang lain.”

NewsRoom.id

Berita Terkait

Game pertempuran baru Marvel terlihat luar biasa
Bos berjanji untuk pergi ke toko topshop ketika plot ikon mode Inggris kembali
Teknologi MIT baru dapat memotong energi pemurnian minyak sebesar 90%
Para ilmuwan terkejut ketika struktur kristal berubah menjadi katalis super
Untuk perubahan trailer yang baik berubah
AI generatif menulis ulang aturan ritel
Ilmuwan mengungkapkan kimia “alien” di bawah deposit lithium terbesar di bumi
300 juta tahun teka -teki: Peneliti mengungkapkan instruksi baru untuk batuan dasar misterius Antartika

Berita Terkait

Kamis, 5 Juni 2025 - 14:33 WIB

Game pertempuran baru Marvel terlihat luar biasa

Kamis, 5 Juni 2025 - 12:29 WIB

Bos berjanji untuk pergi ke toko topshop ketika plot ikon mode Inggris kembali

Kamis, 5 Juni 2025 - 11:26 WIB

Teknologi MIT baru dapat memotong energi pemurnian minyak sebesar 90%

Kamis, 5 Juni 2025 - 10:24 WIB

Para ilmuwan terkejut ketika struktur kristal berubah menjadi katalis super

Kamis, 5 Juni 2025 - 08:20 WIB

Untuk perubahan trailer yang baik berubah

Kamis, 5 Juni 2025 - 05:45 WIB

Ilmuwan mengungkapkan kimia “alien” di bawah deposit lithium terbesar di bumi

Kamis, 5 Juni 2025 - 04:43 WIB

300 juta tahun teka -teki: Peneliti mengungkapkan instruksi baru untuk batuan dasar misterius Antartika

Kamis, 5 Juni 2025 - 02:39 WIB

'Sinners 2' tidak ada dalam pikiran Ryan Coogler, tapi mungkin itu telah berubah

Berita Terbaru

Headline

Game pertempuran baru Marvel terlihat luar biasa

Kamis, 5 Jun 2025 - 14:33 WIB

Headline

Untuk perubahan trailer yang baik berubah

Kamis, 5 Jun 2025 - 08:20 WIB