कार्ल मालामुद की टिप्पणियां
हथिया लिया है। अगले तीन महीनों तक, मैंने उनकी पुस्तकों को हथिया कर अपने सर्वर पर उतारना शुरू कर दिया।
इस काम में थोड़ा समय लगा। यह डाटा लगभग 30 टेराबाइट का था। मैंने उनके 4,63,000 पुस्तकों को प्राप्त करने में मैं सफल रहा। जिनमें से कुछ मुझे नहीं मिल पाए और कुछ पुस्तकों के URL अधूरे थे, लेकिन हमें 4,63,000 PDF फाइलें प्राप्त हुईं।
यह पिछले वर्ष (2016) का दिसबंर का महीना था और जनवरी महीने में मैंने इसे “इंटरनेट आर्काइव' पर अपलोड कर दिया। जब आप इतनी अधिक मात्रा में कार्य करते हैं और उन्हें अपलोड करते हैं, तब ऐसी चीजें को अपलोड होने में समय लगता हैं। अब मैंने इस संग्रह। को बारीकी से देखना शुरू किया है। मैं तब तक इसके बारे में वास्तविक रूप से कुछ नहीं बता सकता जब तक मुझे डाटा न मिल जाए।
यहां 50 विभिन्न भाषाओं की पुस्तकें उपलब्ध हैं। मेरा मानना है कि यहां 30,000 पुस्तकें संस्कत भाषा में हैं। जहां दस हजार पस्तकें गजराती, बंगाली, हिंदी, पंजाबी और तेलग आदि भाषाओं में उपलब्ध हैं। इस संग्रह में लगभग आधी पुस्तकें अंग्रेजी, फ्रेंच और जर्मन भाषाओं में उपलब्ध हैं, लेकिन फिर भी यह अद्भुत संग्रह है।
अभी, इसमें भी कई समस्याएं हैं। जब मैंने इनको ‘मिरर सर्वर पर कापी करना शुरू किया तो करीब 500 बार सिस्टम ने गलती (एरर) बताये। अनेक बार प्रोगाम रुका, अनेक बार मेरा स्क्रिप्ट भी। अगले दिन फिर मैं जाता और फिर मैं अपना स्क्रिप्ट चलाता। इस तरह मुझे बहुत से डाटा प्राप्त हुए। और फिर कई बार उनका DNS भी काम करना बंद कर देता। उनका DNS लगातार डाउन होता रहता था।
यदि आप DNS को नाम से खोजेगें तो यह बताएगा कि “होस्ट नहीं मिला,” और ऐसी समस्या बार-बार आएगी। मैंने आई.पी. एड्रेस को ‘हाई कोड' करना शुरू किया क्योंकि मेरे पास दस्तावेजों को प्राप्त करने का केवल यही तरीका बचा था। वहां पर, खराब हॉस्टिंग के अलावा अन्य मुद्दे भी हैं। मेटाडाटा एक अव्यवस्थित रूप में है। अधिकांश शीर्षक टूटे हुए हैं। कुछ स्कैनिंग, सही तरीके से हैं और कुछ ठीक तरीके से नहीं हैं।
यहां पर अनेक प्रतिलिपि दुबारा डाले हुए हैं लेकिन फिर भी यह अद्भुत संग्रह है। मैंने यह भी देखा कि वहां पर ऐसी कुछ पुस्तकें थी, जो कॉपीराइट के आधार पर बहुत रोचक लग रही थी। मैंने उन्हें देखा और कहा कि इनमें से कुछ पुस्तके हाल के ही छपे हुए हैं। लेकिन मैंने नीचे कॉपीराइट वाले स्थान पर “इस पर कॉपीराइट नहीं है” लिखा हुआ देखा। इसलिए मैंने सोंचा “उन्हें जरुर ही पता होगा कि वे क्या कर रहे हैं।"
मैं आर्काइव पर कुछ ऐसा करता हूँ कि मैं उन्हें इंटरनेट पर डालता हूँ। यदि लोग इसकी शिकायत करना शुरू करते हैं तो हम कहते हैं “ठीक है, मैं इसे हटा देता हूँ।” इसलिए मैंने इसे इंटरनेट पर डाल दिया है और वह इस वर्ष के फरवरी महीने से ऑनलाइन हो गया है। हमें अब तक, इस संग्रह पर पचास लाख लोग देखने आ चुके हैं।
81