Google ने अभी हाल ही में DeepMind और Google Brain को एक बड़ी AI टीम में संयोजित किया है। ये नया Google DeepMind YouTube शॉर्ट्स के लिए डिस्क्रिप्शन जनरेट करने का काम करता है।
Google ने हाल ही में DeepMind और Brain teams को Google DeepMind नामक एक बड़ी AI टीम में मिला दिया। नई टीम ने अब एक साथ अपने पहले काम पर डिटेल साझा किया है। इसमें एक सामूहिक विवरण शामिल है, जो बताता है कि YouTube शॉर्ट्स के लिए डिस्क्रिप्शन जनरेट करने में उसके एक विजुअल लैंग्वेज मॉडल (VLM) का उपयोग कैसे किया जा रहा है।
क्यों बनाया गया ये AI?
Google डीपमाइंड ने पोस्ट में बताया कि शॉर्ट्स कुछ ही मिनटों में बनाए जाते हैं और अक्सर इसमें डिस्क्रिप्शन और सहायक शीर्षक शामिल नहीं होते हैं, जिससे उन्हें सर्च के माध्यम से खोजना कठिन हो जाता है। इसलिए हमने अपने विजुअल लैंग्वेज मॉडल फ्लेमिंगो को डिस्क्रिप्शन जनरेट करने में मदद करने के लिए पेश किया।
क्या है फ्लेमिंगो?
फ्लेमिंगो नामक विजुअल लैंग्वेज मॉडल है, जो वीडियो में क्या चल रहा है यह समझाने के लिए वीडियो के शुरुआती फ्रेम्स को एनालाइज करके डिटेल बना सकता है। बता दें कि फ्लेमिंगो सभी नए शॉर्ट्स के लिए विवरण तैयार कर रहा है।
एक उदाहरण की मदद से आप इसे समझ सकते हैं कि मान लीजिए हमारे पास एक वीडियो है, जिसमें समुद्र तट पर एक आदमी है तो इसका डिस्क्रिप्शन ‘a video of a man on a beach’ हो सकता है। अब ये टेक्स्ट डिस्क्रिप्शन मेटाडेटा के रूप में वीडियो को बेहतर ढंग से वर्गीकृत करने और दर्शकों के प्रश्नों से सर्च रिजल्ट का मिलान करने के लिए संग्रहीत किया जाएगा।
Deepmind ने ट्वीट करके इसके बारे में विस्तरित जानकारी दी है। आइये इसके बारे में जानते हैं।
कैसे करता है काम?
टीम ने अपने नोट में बताय कि मॉडल शॉर्ट के शुरुआती वीडियो फ्रेम का विश्लेषण करके बताता है कि स्क्रीन पर क्या दिखाया जा रहा है। इस टेक्स्ट को YouTube में मेटाडेटा के रूप में वीडियो को बेहतर ढंग से वर्गीकृत करने और यूजर्स के प्रश्नों से सर्च रिजल्ट का मिलान करने के लिए संग्रहीत किया जाता है।
उपयोगकर्ताओं के लिए क्या है खास?
मेटाडेटा में डिस्क्रिप्शन शॉर्ट्स की खोज क्षमता को बेहतर करेगा। इसका मतलब है कि यूजर्स यूट्यूब पर वीडियो को तेजी से सर्च कर पाएंगे। वहीं दर्शक दुनिया भर से अधिक वीडियो खोज सकते हैं और निर्माता बिना किसी अतिरिक्त प्रयास के अपने शॉर्ट्स खोज सकते हैं।