विकेंद्रीकृत AI समाधान प्रदाता Oort द्वारा विकसित एक कृत्रिम खुफिया प्रशिक्षण छवि डेटा सेट Google के प्लेटफ़ॉर्म Kaggle पर काफी सफलता देखी गई।
Oort के विविध उपकरण kaggle डेटा सेट प्रविष्टि अप्रैल की शुरुआत में जारी किया गया था; तब से, यह कई श्रेणियों में पहले पृष्ठ पर चढ़ गया है। Kaggle डेटा विज्ञान और मशीन लर्निंग प्रतियोगिताओं, सीखने और सहयोग के लिए एक Google के स्वामित्व वाला ऑनलाइन प्लेटफ़ॉर्म है।
क्रिप्टो एआई प्रोजेक्ट ओपनडेलर के मुख्य योगदानकर्ता रामकुमार सुब्रमण्यम ने कोइंटेलेग्राफ को बताया कि “एक फ्रंट-पेज कागल रैंकिंग एक मजबूत सामाजिक संकेत है, यह दर्शाता है कि डेटा सेट डेटा वैज्ञानिकों, मशीन लर्निंग इंजीनियरों और प्रैक्टिशनर्स के सही समुदायों को उलझा रहा है।”
Oortelegraph के संस्थापक और सीईओ मैक्स ली ने Cointelegraph को बताया कि फर्म ने “एक विकेंद्रीकृत मॉडल के माध्यम से एकत्र किए गए अपने प्रशिक्षण डेटा की शुरुआती मांग और प्रासंगिकता को मान्य करने वाले होनहार सगाई मेट्रिक्स का अवलोकन किया। उन्होंने कहा:
“सक्रिय उपयोग और योगदान सहित समुदाय से कार्बनिक हित-यह दर्शाता है कि Oorts जैसी विकेन्द्रीकृत, समुदाय-संचालित डेटा पाइपलाइनों को केंद्रीकृत बिचौलियों पर भरोसा किए बिना तेजी से वितरण और जुड़ाव प्राप्त कर सकते हैं।”
ली ने यह भी कहा कि आने वाले महीनों में, Oort ने कई अन्य डेटा सेट जारी करने की योजना बनाई है। उनमें से एक इन-कार वॉयस कमांड डेटा सेट है, एक स्मार्ट होम वॉयस कमांड के लिए और डीपफेक वीडियो के लिए एक और एक है जो एआई-संचालित मीडिया सत्यापन में सुधार करना है।
संबंधित: एआई एजेंट डेफी के लिए आ रहे हैं – बटुए सबसे कमजोर लिंक हैं
प्रश्न में सेट किए गए डेटा को इस महीने की शुरुआत में कगल के जनरल एआई, रिटेल एंड शॉपिंग, मैन्युफैक्चरिंग और इंजीनियरिंग श्रेणियों में पहले पेज पर पहुंचने के लिए स्वतंत्र रूप से सत्यापित किया गया था। प्रकाशन के समय, इसने उन पदों को खो दिया, जो संभवतः 6 मई को एक संभवतः असंबंधित डेटा सेट अपडेट के बाद और 14 मई को एक और।
उपलब्धि को पहचानते हुए, सुब्रमण्यम ने कोइन्टेलग्राफ को बताया कि “यह वास्तविक दुनिया को अपनाने या उद्यम-ग्रेड गुणवत्ता का एक निश्चित संकेतक नहीं है।” उन्होंने कहा कि ओर्ट के डेटा सेट को अलग करने के लिए “केवल रैंकिंग नहीं है, बल्कि डेटा सेट के पीछे की सिद्धता और प्रोत्साहन परत है।” उन्होंने समझाया:
“केंद्रीकृत विक्रेताओं के विपरीत, जो अपारदर्शी पाइपलाइनों पर भरोसा कर सकते हैं, एक पारदर्शी, टोकन-इंसिपाइज़्ड सिस्टम ट्रैसेबिलिटी, कम्युनिटी क्यूरेशन प्रदान करता है, और सही शासन को मानने के लिए निरंतर सुधार की क्षमता है।”
एआई वेंचर कैपिटल फर्म जेनरल वेंचर्स के पार्टनर लेक्स सोकोलिन ने कहा कि जबकि उन्हें नहीं लगता कि इन परिणामों को दोहराना मुश्किल है, “यह दिखाता है कि क्रिप्टो परियोजनाएं आर्थिक रूप से मूल्यवान गतिविधि को व्यवस्थित करने के लिए विकेंद्रीकृत प्रोत्साहन का उपयोग कर सकती हैं।”
संबंधित: स्वेट वॉलेट एआई असिस्टेंट जोड़ता है, मल्टीचैन डेफी के लिए विस्तार करता है
डेटा प्रकाशित एआई रिसर्च फर्म एपोच एआई द्वारा अनुमान है कि मानव-जनित पाठ एआई प्रशिक्षण डेटा 2028 में समाप्त हो जाएगा। दबाव पर्याप्त है कि निवेशक अब हैं मध्यस्थता एआई कंपनियों को कॉपीराइट की गई सामग्रियों को अधिकार देने वाले सौदे।
तेजी से दुर्लभ एआई प्रशिक्षण डेटा से संबंधित रिपोर्टें और यह अंतरिक्ष में वृद्धि को कैसे सीमित कर सकती है घूम सालों के लिए। जबकि सिंथेटिक (एआई-जनरेटेड) डेटा का उपयोग कम से कम कुछ हद तक सफलता के साथ किया जाता है, मानव डेटा को अभी भी काफी हद तक बेहतर वैकल्पिक, उच्च-गुणवत्ता वाले डेटा के रूप में देखा जाता है जो बेहतर एआई मॉडल की ओर जाता है।
जब यह विशेष रूप से एआई प्रशिक्षण के लिए छवियों की बात आती है, तो उद्देश्य पर प्रशिक्षण प्रयासों को तोड़फोड़ करने वाले कलाकारों के साथ चीजें तेजी से जटिल हो रही हैं। बिना अनुमति के एआई प्रशिक्षण के लिए उपयोग किए जाने से उनकी छवियों की रक्षा करने का मतलब है, नैटशाइड उपयोगकर्ताओं को अपनी छवियों को “जहर” करने की अनुमति देता है और मॉडल के प्रदर्शन को गंभीर रूप से नीचा दिखाता है।
सुब्रमण्यम ने कहा, “हम एक ऐसे युग में प्रवेश कर रहे हैं जहां उच्च गुणवत्ता वाली छवि डेटा तेजी से दुर्लभ हो जाएगा।” उन्होंने यह भी माना कि छवि विषाक्तता की बढ़ती लोकप्रियता से यह बिखराव अधिक गंभीर है:
“जहर एआई प्रशिक्षण के लिए छवि क्लोकिंग और प्रतिकूल वॉटरमार्किंग जैसी तकनीकों के उदय के साथ, ओपन-सोर्स डेटासेट एक दोहरी चुनौती का सामना करते हैं: मात्रा और विश्वास।”
इस स्थिति में, सुब्रमण्यम ने कहा कि सत्यापन योग्य और सामुदायिक-खट्टा प्रोत्साहन डेटा सेट “पहले से कहीं अधिक मूल्यवान हैं।” उनके अनुसार, इस तरह की परियोजनाएं “न केवल विकल्प बन सकती हैं, बल्कि एआई संरेखण के स्तंभ और डेटा अर्थव्यवस्था में सिद्धता।”