सरकार द्वारा कॉपीराइट सामग्री पर एआई प्रशिक्षण के लिए एक व्यापक लाइसेंस को अनिवार्य करने वाले हाइब्रिड मॉडल के प्रस्ताव पर अपना वर्किंग पेपर जारी करने के दो दिन बाद, भारत के आईटी उद्योग निकाय नैसकॉम और कई बड़ी तकनीकी कंपनियों ने इस प्रस्ताव को व्यवहार में लागू करना असंभव नहीं तो मुश्किल बताया है।
जबकि उद्योग संवर्धन और आंतरिक व्यापार विभाग (डीपीआईआईटी) द्वारा गठित समिति के अधिकांश सदस्यों ने उस मॉडल का समर्थन किया, जिसके लिए एआई कंपनियों को रचनाकारों को भुगतान करने की आवश्यकता होगी और अधिकार धारकों को एआई प्रशिक्षण से बाहर निकलने की अनुमति नहीं होगी, नैसकॉम ने तकनीकी, आर्थिक और प्रवर्तन चुनौतियों का हवाला देते हुए औपचारिक रूप से असहमति जताई है।
समिति को अपने लिखित प्रस्तुतीकरण में, नैसकॉम, जिसके दो सदस्य अप्रैल में गठित डीपीआईआईटी समिति का हिस्सा हैं, ने कहा कि भारत को एआई प्रशिक्षण के लिए टेक्स्ट और डेटा माइनिंग (टीडीएम) की अनुमति देनी चाहिए, जब तक सामग्री कानूनी रूप से उपलब्ध है। शीर्ष आईटी निकाय ने कहा कि रचनाकारों को मशीन-पठनीय ऑप्ट-आउट या संविदात्मक प्रतिबंधों के माध्यम से एआई प्रशिक्षण को अवरुद्ध करने में सक्षम होना चाहिए।
एचटी को पता चला है कि डीपीआईआईटी केवल नैसकॉम की असहमति का सारांश रखना चाहता था, लेकिन व्यापार निकाय के आग्रह पर, पूरे 24 पेज की लिखित प्रस्तुति को रिपोर्ट में अनुलग्नक के रूप में जोड़ा गया था।
एआई मॉडल के अर्थशास्त्र पर चिंता जताते हुए, नैसकॉम से जुड़े एक व्यक्ति ने कहा कि चैटजीपीटी जैसे सामान्य-उद्देश्य वाले एआई मॉडल, जहां पिछले कुछ वर्षों में कमोडिटीकरण के कारण टोकन की कीमतों में तेजी से गिरावट आई है, बहुत कम मार्जिन पर काम करते हैं। “यदि आप 2023 से आज तक टोकन दरों की तुलना करते हैं, तो 95% की कमी पहले ही हो चुकी है। वैसे भी इनमें से कोई भी जीपीटी प्रदाता आज लाभदायक नहीं है। उस परिदृश्य में, अनिवार्य रॉयल्टी को बनाए रखना मुश्किल हो जाता है,” व्यक्ति ने कहा
डीपीआईआईटी समिति के प्रस्ताव के तहत, एआई कंपनियां व्यक्तिगत रचनाकारों के साथ बातचीत करने के बजाय एकल, केंद्रीय निकाय को रॉयल्टी का भुगतान करेंगी। यह प्रस्तावित निकाय, जिसे कॉपीराइट रॉयल्टी कलेक्टिव फॉर एआई ट्रेनिंग (सीआरसीएटी) कहा जाता है, भुगतान एकत्र करेगा, जो संभवतः सरकार द्वारा नियुक्त समिति द्वारा तय किया जाएगा और एआई कंपनी के राजस्व या पैमाने से जुड़ा होगा, और फिर लेखकों, कलाकारों, प्रकाशकों और समाचार संगठनों जैसे अधिकार धारकों को धन वितरित करेगा।
ऊपर उद्धृत व्यक्ति ने कहा कि बड़े भाषा मॉडल (एलएलएम) कॉपीराइट सामग्री को उसके मूल रूप में संग्रहीत या पुन: पेश नहीं करते हैं, बल्कि पाठ को संभावित रूप से संसाधित संख्यात्मक टोकन में परिवर्तित करते हैं। “मॉडल के अंदर जो मौजूद है वह संख्याएं हैं, शब्द नहीं,” व्यक्ति ने कहा, आउटपुट हर संकेत के साथ बदलता है, जिससे विशिष्ट कॉपीराइट सामग्री का पता लगाना या उसका श्रेय देना या उसके उपयोग का विरोध करना बेहद मुश्किल हो जाता है।
उस व्यक्ति ने यह भी बताया कि एआई डेवलपर्स यादृच्छिकता को बढ़ाकर या मॉडल में शोर जोड़कर ट्रैसेबिलिटी को और कम कर सकते हैं, ऐसा कुछ जो एआई कंपनियों के खिलाफ कॉपीराइट मुकदमों के बाद विश्व स्तर पर पहले से ही हो रहा है। उन्होंने कहा, यह सवाल उठाता है कि रॉयल्टी या लाइसेंसिंग प्रणाली को व्यवहार में कैसे लागू किया जाएगा।
वर्तमान में, OpenAI, Perplexity AI जैसी कंपनियां कॉपीराइट डेटा का उपयोग करके अपने AI मॉडल को प्रशिक्षित करने को लेकर मुकदमों में उलझी हुई हैं।
नैसकॉम से जुड़े एक अन्य व्यक्ति ने कहा, मेटा और गूगल जैसी बड़ी तकनीकी कंपनियों को डीपीआईआईटी का प्रस्ताव पसंद नहीं है क्योंकि इससे उनके लिए अपने एआई मॉडल को प्रशिक्षित करना कठिन और महंगा हो जाएगा।
एक बड़ी तकनीकी कंपनी से निकटता से जुड़े एक उद्योग कार्यकारी, जिसे डीपीआईआईटी समिति ने परामर्श दिया था, ने तर्क दिया कि एआई वास्तव में सामग्री बनाने की लागत को कम करता है और रचनाकारों को और अधिक करने में मदद करता है। फर्म ने यूरोपीय संघ, जापान और सिंगापुर का हवाला देते हुए यह भी कहा कि टीडीएम अपवाद की अस्वीकृति अनुचित है, जो पहले से ही इसकी अनुमति देते हैं। सबसे महत्वपूर्ण बात यह है कि इसमें चेतावनी दी गई है कि प्रस्तावित अनिवार्य ब्लैंकेट लाइसेंस एआई विकास को महंगा और कानूनी रूप से जोखिम भरा बना देगा, स्टार्टअप्स को नुकसान पहुंचाएगा, भारत में एआई को अपनाने की गति धीमी हो जाएगी और डेवलपर्स को लंबी कानूनी लड़ाई का सामना करना पड़ेगा।
टेक पॉलिसी थिंक टैंक द डायलॉग की एसोसिएट डायरेक्टर जमीला साहिबा ने कहा कि इस कदम से भारत के स्टार्टअप इकोसिस्टम को नुकसान होगा। “बड़ी प्रौद्योगिकी कंपनियों के विपरीत, स्टार्टअप सीमित पूंजी, कम टीमों और छोटे रनवे के साथ काम करते हैं; रॉयल्टी-शेयरिंग दायित्वों और व्यापक अनुपालन आवश्यकताओं को पेश करने से एआई विकास में प्रवेश की निश्चित लागत में काफी वृद्धि होती है… यहां तक कि मामूली लाइसेंसिंग दायित्व भी प्रारंभिक चरण में चुनौतीपूर्ण हो सकते हैं जब राजस्व अनियमित या अस्तित्वहीन होता है, और नियामक ओवरहेड्स परिचालन बजट को जल्दी से ग्रहण कर सकते हैं, “उसने कहा।
एक अन्य बड़ी टेक कंपनी से जुड़े एक उद्योग कार्यकारी, जिनसे डीपीआईआईटी समिति ने भी परामर्श लिया था, ने एचटी को बताया कि जिस तरह से समिति का गठन किया गया है, उसने भी सिफारिश में बहुत बड़ी भूमिका निभाई है। कार्यकारी ने आरोप लगाया, “हर कोई पहले से जानता था कि सिफारिश प्रकाशकों के पक्ष में होगी…”। समिति के सदस्यों में एमिकस क्यूरी से लेकर ओपनएआई बनाम एएनआई मामले के वकील आदर्श रामानुजन और वकील अमीत दत्ता शामिल हैं, जो इसी मामले में डिजिटल समाचार समूह के वकील हैं।
एचटी ने पहले बताया था कि एक सदस्य ने यह कहते हुए समिति से हटाने की मांग की थी कि वे खुद को एआई या कॉपीराइट का विशेषज्ञ नहीं मानते हैं, लेकिन डीपीआईआईटी को पत्र लिखकर उन्हें वापस लेने की मांग करने के बावजूद वे पैनल का हिस्सा बने रहे।
बिग टेक द्वारा इंगित एक और अंतर यह है कि डीपीआईआईटी समिति की सिफारिश 5 नवंबर को जारी एआई गवर्नेंस फ्रेमवर्क का खंडन करती है, जिसने डीपीआईआईटी पैनल को “एक संतुलित दृष्टिकोण पर विचार करने के लिए कहा, जो कॉपीराइट धारकों के अधिकारों की रक्षा करते हुए टेक्स्ट और डेटा माइनिंग को सक्षम बनाता है”।
प्रधान वैज्ञानिक सलाहकार के नेतृत्व वाली उप-समिति ने पिछले महीने विचार के लिए आईटी मंत्रालय को रूपरेखा सौंपी थी। हालाँकि, वर्किंग पेपर के अनुसार, आईटी मंत्रालय ने DPIIT समिति की सिफारिशों का समर्थन किया है। निश्चित रूप से, एआई शासन ढांचा कानूनी रूप से बाध्यकारी नहीं है।
