पृष्ठ:कोड स्वराज.pdf/८९

विकिस्रोत से
यह पृष्ठ जाँच लिया गया है।

कार्ल मालामुद की टिप्पणियां

हथिया लिया है। अगले तीन महीनों तक, मैंने उनकी पुस्तकों को हथिया कर अपने सर्वर पर उतारना शुरू कर दिया।

इस काम में थोड़ा समय लगा। यह डाटा लगभग 30 टेराबाइट का था। मैंने उनके 4,63,000 पुस्तकों को प्राप्त करने में मैं सफल रहा। जिनमें से कुछ मुझे नहीं मिल पाए और कुछ पुस्तकों के URL अधूरे थे, लेकिन हमें 4,63,000 PDF फाइलें प्राप्त हुईं।

यह पिछले वर्ष (2016) का दिसबंर का महीना था और जनवरी महीने में मैंने इसे “इंटरनेट आर्काइव' पर अपलोड कर दिया। जब आप इतनी अधिक मात्रा में कार्य करते हैं और उन्हें अपलोड करते हैं, तब ऐसी चीजें को अपलोड होने में समय लगता हैं। अब मैंने इस संग्रह। को बारीकी से देखना शुरू किया है। मैं तब तक इसके बारे में वास्तविक रूप से कुछ नहीं बता सकता जब तक मुझे डाटा न मिल जाए।

यहां 50 विभिन्न भाषाओं की पुस्तकें उपलब्ध हैं। मेरा मानना है कि यहां 30,000 पुस्तकें संस्कत भाषा में हैं। जहां दस हजार पस्तकें गजराती, बंगाली, हिंदी, पंजाबी और तेलग आदि भाषाओं में उपलब्ध हैं। इस संग्रह में लगभग आधी पुस्तकें अंग्रेजी, फ्रेंच और जर्मन भाषाओं में उपलब्ध हैं, लेकिन फिर भी यह अद्भुत संग्रह है।

अभी, इसमें भी कई समस्याएं हैं। जब मैंने इनको ‘मिरर सर्वर पर कापी करना शुरू किया तो करीब 500 बार सिस्टम ने गलती (एरर) बताये। अनेक बार प्रोगाम रुका, अनेक बार मेरा स्क्रिप्ट भी। अगले दिन फिर मैं जाता और फिर मैं अपना स्क्रिप्ट चलाता। इस तरह मुझे बहुत से डाटा प्राप्त हुए। और फिर कई बार उनका DNS भी काम करना बंद कर देता। उनका DNS लगातार डाउन होता रहता था।

यदि आप DNS को नाम से खोजेगें तो यह बताएगा कि “होस्ट नहीं मिला,” और ऐसी समस्या बार-बार आएगी। मैंने आई.पी. एड्रेस को ‘हाई कोड' करना शुरू किया क्योंकि मेरे पास दस्तावेजों को प्राप्त करने का केवल यही तरीका बचा था। वहां पर, खराब हॉस्टिंग के अलावा अन्य मुद्दे भी हैं। मेटाडाटा एक अव्यवस्थित रूप में है। अधिकांश शीर्षक टूटे हुए हैं। कुछ स्कैनिंग, सही तरीके से हैं और कुछ ठीक तरीके से नहीं हैं।

यहां पर अनेक प्रतिलिपि दुबारा डाले हुए हैं लेकिन फिर भी यह अद्भुत संग्रह है। मैंने यह भी देखा कि वहां पर ऐसी कुछ पुस्तकें थी, जो कॉपीराइट के आधार पर बहुत रोचक लग रही थी। मैंने उन्हें देखा और कहा कि इनमें से कुछ पुस्तके हाल के ही छपे हुए हैं। लेकिन मैंने नीचे कॉपीराइट वाले स्थान पर “इस पर कॉपीराइट नहीं है” लिखा हुआ देखा। इसलिए मैंने सोंचा “उन्हें जरुर ही पता होगा कि वे क्या कर रहे हैं।"

मैं आर्काइव पर कुछ ऐसा करता हूँ कि मैं उन्हें इंटरनेट पर डालता हूँ। यदि लोग इसकी शिकायत करना शुरू करते हैं तो हम कहते हैं “ठीक है, मैं इसे हटा देता हूँ।” इसलिए मैंने इसे इंटरनेट पर डाल दिया है और वह इस वर्ष के फरवरी महीने से ऑनलाइन हो गया है। हमें अब तक, इस संग्रह पर पचास लाख लोग देखने आ चुके हैं।

81