Google, raksasa teknologi, telah meningkatkan kemampuan Google Lens dengan memperkenalkan fitur pencarian informasi berdasarkan video. Sebelumnya, alat pengenalan gambar ini hanya memungkinkan pengguna untuk mencari informasi berdasarkan gambar dan teks. Kini, melalui Google Lens, pengguna dapat merekam video selama 20 detik dan melakukan pencarian informasi berdasarkan video tersebut. Misalnya, ketika berada di akuarium dan ingin mempelajari lebih lanjut tentang ikan, pengguna dapat membuka Google Lens di smartphone mereka dan merekam video untuk mengetahui informasi yang diinginkan.

Ketika menggunakan Google Lens untuk mencari informasi berdasarkan video, pengguna hanya perlu menahan tombol “Search” di tengah layar saat merekam video. Selama proses perekaman, pengguna akan melihat instruksi “Speak now to ask about this video,” yang memungkinkan pengguna untuk bertanya dan mengetahui lebih lanjut tentang objek yang direkam. Sebagai contoh, pengguna dapat bertanya, misalnya, “Mengapa ikan-ikan tersebut berenang bersama-sama?” untuk mendapatkan penjelasan lebih lanjut.

Dengan dukungan teknologi kecerdasan buatan (AI) Gemini AI, Google Lens akan menampilkan AI Overview, yaitu fitur Google Search yang merangkum informasi dari berbagai situs web. Informasi yang disajikan oleh AI Overview ini memungkinkan pengguna untuk mendapatkan informasi yang relevan dan lengkap mengenai objek yang direkam dalam video. Google Lens tidak hanya memberikan kemudahan dalam mencari informasi berdasarkan gambar dan teks, tetapi juga membuka pintu untuk pengguna melakukan pencarian berdasarkan video dengan mengintegrasikan fitur AI yang canggih.

Inovasi Google Lens dalam memungkinkan pencarian informasi berdasarkan video membuka peluang baru bagi pengguna untuk mendapatkan pengetahuan lebih dalam tentang berbagai objek di sekitar mereka. Dengan fungsionalitas baru ini, Google Lens menjadi alat yang lebih canggih dan berguna dalam memberikan informasi yang terperinci dan bermanfaat berdasarkan rekaman video. Peningkatan kemampuan Google Lens ini merupakan langkah maju yang memperluas cara pengguna berinteraksi dengan teknologi untuk memperoleh informasi yang mereka butuhkan.

Penggunaannya yang mudah dan intuitif membuat Google Lens menjadi solusi praktis untuk mereka yang ingin mengeksplorasi pengetahuan lebih lanjut tentang objek di sekitar mereka melalui video. Dengan menggabungkan teknologi AI yang canggih dengan fitur pencarian berbasis video, Google Lens membuka potensi baru dalam pengalaman berbagi informasi dan pengetahuan. Ini menunjukkan komitmen Google dalam terus menghadirkan inovasi teknologi yang memberikan nilai tambah serta memperluas cara pengguna berinteraksi dengan informasi di era digital saat ini.

Google lens (2)

AI Overview juga akan menampilkan beberapa tautan jika pengguna ingin menjelajahi informasi lebih mendalam. Menurut Rajan Patel, Vice President of Engineering di Google, Google dapat mengonversi video yang direkam menjadi serangkaian gambar (frame). Google kemudian menggunakan teknik visi komputer yang sama yang telah diterapkan sebelumnya di Google Lens. Namun, langkah Google tidak berhenti di situ saja. Mereka meneruskan informasi gambar ke model khusus bernama Gemini. Model Gemini dirancang untuk memahami sekumpulan gambar secara berurutan dan memberikan respons berdasarkan pencarian web.

Fitur ini sebenarnya pernah dipamerkan dalam acara Google I/O pada bulan Mei 2024. Namun, saat ini fitur tersebut belum mampu mengidentifikasi suara. Misalnya, pengguna tidak bisa menggunakan fitur ini untuk mengenali jenis burung dari suara kicauannya. Patel menjelaskan bahwa Google masih dalam tahap bereksperimen terkait kemampuan identifikasi suara tersebut. Google mengambil langkah progresif untuk memperluas kemampuan teknologi visi komputer mereka dengan memanfaatkan model Gemini. Respons yang diberikan oleh model ini didasarkan pada data yang diperoleh dari sumber-sumber web yang relevan.

Google terus berinovasi dalam pengembangan teknologi visi komputer. Dengan menggunakan model Gemini, Google dapat memahami beberapa gambar secara berurutan dan memberikan informasi yang lebih mendalam dari web. Meskipun demikian, belum adanya kemampuan identifikasi suara dalam fitur ini menunjukkan bahwa Google masih terus mengembangkan dan menyesuaikan teknologi mereka. Dengan demikian, pengguna dapat memperoleh informasi yang lebih kaya dan terperinci dari gambar yang mereka tangkap menggunakan layanan AI Overview dari Google.