इस लेख का आनंद लिया?
इसे अपने दोस्तों के साथ साझा करें!
Google ने मिथुन 2.5 फ्लैश इमेज नामक एक नया इमेज-केंद्रित मॉडल पेश किया हैसरल पाठ कमांड के माध्यम से दृश्य का उत्पादन और परिष्कृत करने के लिए डिज़ाइन किया गया है।
अद्यतन था आधिकारिक तौर पर 26 अगस्त को जारी किया गया और पहले से ही सभी मिथुन इंटरफेस में रहता है।
इस रोलआउट के साथ, उपयोगकर्ता विस्तृत संपादन कर सकते हैं, जैसे कि किसी व्यक्ति के रुख को समायोजित करना या विभिन्न दृश्यों को संयोजित करना, चेहरे की विशेषताओं या पृष्ठभूमि तत्वों जैसे प्रमुख विवरणों को बदलने के बिना।
क्या आप जानते हैं?
सदस्यता लें – हम हर हफ्ते नए क्रिप्टो व्याख्याकार वीडियो प्रकाशित करते हैं!
बिटकॉइन नल क्या है? पेशेवरों और विपक्षों ने समझाया (एनिमेशन के साथ)
इसके आधिकारिक खुलासा से पहले, उपकरण Lmarena पर सामने आया थाएक ऐसी साइट जहां जनता प्रयोगात्मक कृत्रिम बुद्धिमत्ता (एआई) मॉडल का परीक्षण कर सकती है। “नैनो-बानाना” के तहत उस नाम से जाना जाता हैमॉडल ने अपने चिकनी और विश्वसनीय संपादन के लिए ध्यान आकर्षित किया।
स्टैंडआउट सुविधाओं में से एक इसकी है कई छवियों में एक विषय के लिए एक सुसंगत उपस्थिति रखने की क्षमता। यह विज्ञापन जैसे क्षेत्रों में उपयोगी हो सकता है, जहां किसी उत्पाद या चरित्र को अलग -अलग दृश्यों में समान दिखाई देने की आवश्यकता होती है।
मॉडल कई संदर्भ दृश्य से भी खींच सकता है और आरेखों को समझ सकता है, जो इसे स्रोतों के मिश्रण के आधार पर सटीक दृश्य बनाने की अनुमति देता है।
दुरुपयोग को रोकने में मदद करने के लिए, मॉडल द्वारा उत्पन्न सभी चित्र एक अदृश्य सिंथिड हस्ताक्षर ले जाएंमेटाडेटा के साथ जो उन्हें एआई-जनित के रूप में पहचानता है।
मिथुन 2.5 फ्लैश छवि है न केवल Google के प्लेटफ़ॉर्म के भीतर, बल्कि OpenRouter और Fal.ai के माध्यम से भी उपलब्ध है। यह Google क्लाउड की सेवा की पेशकश में भी एकीकृत है, प्रत्येक मिलियन आउटपुट टोकन के लिए $ 30 की लागत के साथ, जो प्रति छवि लगभग $ 0.04 में अनुवाद करता है।
13 अगस्त को, Google ने मिथुन एआई के लिए एक अपडेट किया। इस संस्करण में नया क्या है? पूरी कहानी पढ़ें।