VLOOD.ID - Google DeepMind semakin memperluas cakupan kecerdasan buatannya dengan meluncurkan Gemini Robotics dan Gemini Robotics-ER. Kedua model robot ini dirancang untuk membawa AI ke dunia nyata dengan menggabungkan berbagai modalitas seperti teks, gambar, audio, video, serta tindakan fisik.
Robot-robot ini tidak hanya memahami perintah secara bahasa alami, tetapi juga mampu mengeksekusi tugas-tugas kompleks, mulai dari mengemas barang hingga berinteraksi dengan lingkungan 3D secara presisi.
Gemini Robotics: Robot AI yang Fleksibel dan Interaktif
Robotika Gemini menggunakan model visi-bahasa-tindakan, yang memungkinkan robot untuk memahami instruksi dan mengeksekusinya secara langsung. Model ini dirancang untuk interaktivitas tinggi, sehingga dapat melakukan berbagai tugas sehari-hari, seperti:
- Mengemas barang
- Melipat origami
- Menyesuaikan diri dengan lingkungan sekitar
Dengan kombinasi AI dan kecerdasan fisik, robot ini semakin mendekati konsep asisten robot yang mampu membantu dalam kehidupan sehari-hari.
Gemini Robotics-ER: Robot dengan Penalaran Spasial Lanjutan
Berbeda dari model sebelumnya, Gemini Robotics-ER lebih fokus pada penalaran spasial dan penalaran yang diwujudkan. Ini berarti robot dapat memahami objek dan ruang dengan lebih akurat, memungkinkan interaksi yang lebih kompleks.
Kemampuan utama Gemini Robotics-ER meliputi:
- Memahami dan berinteraksi dalam dunia 3D
- Menggenggam objek dengan aman, seperti memegang cangkir kopi tanpa menjatuhkannya
- Kontrol penuh terhadap persepsi, perencanaan, dan pemahaman spasial
- Pembuatan kode otomatis untuk menyesuaikan instruksi dengan situasi tertentu
Dengan teknologi ini, robot tidak hanya mengikuti instruksi sederhana, tetapi juga dapat mengambil keputusan berdasarkan situasi di sekitarnya.