
आप डेटा में तैर रहे हैं। आप हर दिन नया डेटा बना रहे हैं। यदि आपका स्वास्थ्य ऐप आपके कदमों को गिनाता है? यह नया डेटा है। Oura रिंग जो आपके बायो-मेट्रिक्स को ट्रैक कर रही है? मूल्यवान डेटा। आपके सोशल मीडिया पोस्ट, यहां तक कि बेवकूफ चुटकुले भी जो शून्य पसंद थे? अधिक डेटा।
यह सब डेटा है कि एआई कंपनियों को फसल करना पसंद होगा। आप अच्छे डेटा के बिना अच्छा एआई का निर्माण नहीं कर सकते हैं, यही कारण है कि कई डेटा को एआई के लिए दौड़ में “नए तेल” के रूप में देखते हैं। समस्या, हालांकि, यह है कि आपका डेटा मूल्यवान है जबकि सिद्धांत मेंवास्तविकता यह है कि अपने स्वयं के व्यक्तिगत डेटा का मुद्रीकरण करना कठिन है, क्योंकि आपके पास एक व्यक्ति के रूप में कोई लाभ नहीं है। (ओपन एआई अपने पुराने ट्वीट खरीदने के लिए आपके दरवाजे पर दस्तक नहीं दे रहा है।)
प्रवेश करना पुराना। ओपन डेटा लैब्स के सह-संस्थापक अन्ना कज़लौस्कस कहते हैं, “मुझे लगता है कि डेटा एआई की अगली पीढ़ी के लिए यह मौलिक संसाधन है, और वास्तव में हमारी डिजिटल अर्थव्यवस्था की अगली पीढ़ी है।” “बहुत से लोग स्पष्ट रूप से सिर्फ यह महसूस नहीं करते हैं कि वे वास्तव में अपने डेटा के मालिक हैं।”
लेकिन आप अपना डेटा खुद करते हैं। और यह मूल्यवान है … यदि आप किसी तरह लाखों अन्य लोगों के साथ बलों में शामिल हो सकते हैं जो अपने डेटा के मालिक भी हैं। यह आपको सौदेबाजी की शक्ति देगा। और यह वाना का मिशन है: उपयोगकर्ता के स्वामित्व वाले डेटा के लिए एक पारिस्थितिकी तंत्र बनाने के लिए, जो बदले में उपयोगकर्ता के स्वामित्व वाले एआई को ईंधन देता है।
उस पारिस्थितिकी तंत्र में डेटा DAOS (डेटा के लिए एक “श्रम संघ”) का मिश्रण शामिल है, विकेंद्रीकृत डेटा मार्केटप्लेस, हाल ही में लॉन्च किया गया वीआरसी -20 टोकनऔर एक नया सहयोग दुनिया के पहले उपयोगकर्ता-स्वामित्व वाले मूलभूत मॉडल का निर्माण करने के लिए फूल प्रयोगशालाओं के साथ। (एक प्रदर्शन ए जो विकेंद्रीकृत एआई मुख्यधारा में रेंग रहा है: वाना/फूल सहयोग द्वारा कवर किया गया था तार का।)
Kazlauskas पर एक मुख्य वक्ता एआई शिखर सम्मेलन सर्वसम्मति 2025 पर इस दृष्टि को रेखांकित करते हुए, और वह यहां एक झलक देती है। और वह गति को स्थानांतरित करती देखती है। “हम पहले से ही इस बदलाव को देखना शुरू कर रहे हैं, जहां अधिक लोगों को यह एहसास होता है कि, ‘मेरा डेटा वास्तव में एआई के लिए महत्वपूर्ण है’ और ‘मैं वास्तव में उस का मालिक हूं।’ ” वह भविष्यवाणी करती है कि कुछ वर्षों में, 100 मिलियन से अधिक उपयोगकर्ता जहाज पर रहेंगे। दस वर्षों में? “विश्व जनसंख्या। 10 बिलियन से ऊपर।”
साक्षात्कार को स्पष्टता के लिए संघनित और हल्के से संपादित किया गया है।
उपयोगकर्ता के स्वामित्व वाला डेटा आपके लिए इतना महत्वपूर्ण क्यों है?
अन्ना कज़लौस्कस: ज्यादातर लोग मानते हैं कि डेटा उन प्लेटफार्मों के स्वामित्व में है जो यह बैठा है, लेकिन ऐसा नहीं है। उसी तरह जब आप अपनी कार को पार्किंग में डालते हैं, तो पार्किंग स्थल आपकी कार के मालिक नहीं हैं। आप हमेशा इसे वापस ले सकते हैं। इस पर आपका पूरा स्वामित्व है।
और आज बड़ी मात्रा में पैसा कमाया जा रहा है, ज्यादातर बड़ी टेक कंपनियों द्वारा, उस डेटा से दूर, लेकिन उपयोगकर्ता कानूनी मालिक हैं। इसलिए मुझे लगता है कि यह महत्वपूर्ण है कि हम उस स्वामित्व को पुनर्स्थापित करें, दोनों एक उपयोगकर्ता के नजरिए से और एक डेवलपर के दृष्टिकोण से।
क्या आप डॉट्स को जोड़ सकते हैं कि यह डेवलपर्स की मदद कैसे करता है?
एक डेवलपर के रूप में, विशेष रूप से एआई दुनिया में, सही डेटा तक पहुंच होना वास्तव में महत्वपूर्ण है। और यह अभी करना कठिन है, क्योंकि अधिकांश डेटा बिग टेक के दीवारों वाले बगीचों के भीतर बंद है। मेरे बहुत सारे स्मार्ट दोस्त जो एआई में सामान करते हैं, वे बिग लैब्स में काम करते हैं, क्योंकि यह वह जगह है जहां डेटा है और यही वह जगह है जहां गणना है। लेकिन ऐसा नहीं है।
डेटा DAOs इस दृष्टि में वास्तव में कैसे फिट होते हैं?
तो एक डेटाडाओ डेटा के लिए एक श्रम संघ की तरह है। जहां मूल रूप से आपके पास ऐसे लोगों का एक बड़ा समूह है जो अपने डेटा को एक साथ पूल करते हैं, और फिर उस डेटा के साथ सामूहिक निर्णय ले सकते हैं।
इसका कारण यह है कि यह महत्वपूर्ण है कि आपका डेटा, अपने दम पर, यह उपयोगी नहीं है, है ना? यह बहुत अधिक उपयोगी है जब इसका एक बड़ा पूल है। जब एआई मॉडल को प्रशिक्षित करने के लिए इसमें पर्याप्त है।
आपके द्वारा सबसे अधिक उत्साहित डेटा DAO में से कुछ क्या हैं?
स्वास्थ्य स्थान में कुछ हैं जो वास्तव में दिलचस्प हैं। एक शुरुआती एक है जो वास्तव में रोगी मेडिकल रिकॉर्ड का पूर्ण निर्यात कर रहा है, जो मुझे लगता है कि वास्तव में अंतरिक्ष में बहुत सारे शोध को आगे बढ़ाने में मदद कर सकता है। कुछ बायोमेट्रिक्स, नींद और स्वास्थ्य से संबंधित है। डीएलपी (ड्राइवर लॉयल्टी प्रोग्राम) लैब्स के साथ एक है; वे कार डेटा बना रहे हैं। और उनके डेटा-सेट के भीतर, टेस्ला डेटा वास्तव में दिलचस्प है क्योंकि ज्यादातर लोग टेस्ला के बारे में मूल्यवान मानते हैं क्योंकि उनके पास डेटा लीड है, है ना? दरअसल, उपयोगकर्ताओं को उस डेटा-सेट का एक बहुत कुछ मिल सकता है।
आप सामूहिक -1 का निर्माण करने के लिए फ्लावर लैब्स के साथ नए सहयोग के साथ अभ्यास करने के लिए सिद्धांत से पिवटिंग कर रहे हैं। वहां क्या लक्ष्य है?
COLLECTIVE-1 पहला उपयोगकर्ता-स्वामित्व वाला फाउंडेशन मॉडल है। आमतौर पर जब लोग एक फाउंडेशन मॉडल के बारे में सोचते हैं, तो वे आमतौर पर एक कंपनी के बारे में सोचते हैं, जो एक ही डेटा सेंटर में एक बहुत बड़ी प्रशिक्षण नौकरी चला रही है, है ना? ओपनई की तरह। और इसका कारण यह है कि यह आमतौर पर एक केंद्रीकृत तरीके से किया जाता है क्योंकि इसकी आवश्यकता होती है, एक, एक पूरी तरह से गणना शक्ति, और दो, एक बहुत सारे डेटा।
फ्लावर एआई फेडरेटेड (विकेंद्रीकृत) प्रशिक्षण में अग्रणी है। उन्होंने इन महान खुले स्रोत पुस्तकालयों के निर्माण का एक बहुत अच्छा काम किया है। वे प्रशिक्षण पक्ष और एल्गोरिथ्म पक्ष से आते हैं। और वाना के साथ, हम वास्तव में उस डेटा टुकड़े पर ध्यान केंद्रित करते हैं, है ना? इसलिए हमारे पास मूल रूप से यह सब डेटा है जिसे लोग प्रशिक्षित कर सकते हैं। फिर आप उपयोगकर्ताओं को मॉडल के अंत-स्वामित्व देते हैं, और उपयोगकर्ता यह तय कर सकते हैं कि मॉडल को क्या करने की अनुमति है? तो यह अपनी तरह का पहला फाउंडेशन मॉडल है।
और सिद्धांत यह है कि आखिरकार, बेहतर डेटा के साथ, आप एआई का निर्माण कर सकते हैं जो सिर्फ नहीं है प्रतिस्पर्धी केंद्रीय खिलाड़ियों के साथ लेकिन बेहतरक्या वह सही है? तो यह केवल विचारधारा के बारे में नहीं है, बल्कि प्रदर्शन भी है।
वास्तव में, हाँ यह 100% सही है। एक विकेन्द्रीकृत संदर्भ से, मुझे लगता है कि अक्सर लोग सिद्धांत रूप में सहमत होते हैं कि, “हां, हमारे पास एआई होना चाहिए जो लोगों के स्वामित्व में है। हमें एआई को विकेंद्रीकृत करना चाहिए।” लेकिन क्या बात है कि हम वास्तव में विकेंद्रीकृत संदर्भ में बेहतर कर सकते हैं? डेटा उत्तर है। प्रत्येक कंपनी के लिए, उनके पास केवल एक डेटा-सेट का अपना एकल टुकड़ा होता है। Apple को उनका डेटा मिला। Google को उनका डेटा मिला है। लेकिन अगर आप उपयोगकर्ता के माध्यम से जा रहे हैं, तो आप प्लेटफार्मों में कटौती कर सकते हैं और वास्तव में किसी भी एकल कंपनी की तुलना में बेहतर डेटा-सेट का निर्माण कर सकते हैं। डेटा गुप्त सॉस है जो इसे सभी काम करता है।
इसे प्यार करना। धन्यवाद अन्ना, आप टोरंटो में एआई शिखर सम्मेलन में देखें।
जेफ विल्सर सर्वसम्मति 2025 में एआई शिखर सम्मेलन की मेजबानी करेगा, और मेजबान है पीपुल्स एआई: विकेंद्रीकृत एआई पॉडकास्ट।