डाटा पाइरेसीः तथ्याङ्क चोरिएको चोरियै, नेपाली हेरेको हेर्‍यै

डाटा पाइरेसीः तथ्याङ्क चोरिएको चोरियै, नेपाली हेरेको हेर्‍यै



प्रथमतः डाटाबारे प्रष्ट धारणा राख्नु उपयुक्त होला । डाटा भन्नाले व्यक्तिगत तथ्य, लगत वा सूचनाका वस्तुहरूको गुणात्मक र मात्रात्मक मानहरूको सेट भन्ने बुझिन्छ । नेपालीमा अर्थ नियाल्दा प्रशोधन नगरिएको डाटालाई लगत भनिन्छ भने तथ्याङ्क भन्नाले लगतलाई तथ्यमा ढालिएको वा तथ्यको अङ्कनलाई तथ्याङ्क भनिन्छ ।

व्यक्तिगत कार्य वा व्यवसाय सञ्चालन गर्दा खरिद, बिक्री, राजस्व, घाटा, नाफा, स्टक मूल्य, वित्त, अपराध दर, बेरोजगारी दर, साक्षरता दर, जनसङ्ख्याको गणनामा प्रयोग हुने वस्तु वा सेवाको सूची आदिलाई डाटा भनिन्छ । यही लगतलाई विषयानुसार विश्लेषण गरेर तथ्यमा ढालेपछि त्यसलाई तथ्याङ्क भनिन्छ। अङ्रेजीमा लगतलाई र’डाटा वा अप्रशोधित डाटा र तथ्याङ्कलाई प्रशोधित डाटा भनिन्छ ।

नेपाली बृहत् शब्दकोशमा तथ्याङ्कलाई गणितीय मापनका अङ्क एवं वस्तु वा फेहरिस्तको सूचीका रूपमा लिइएको छ । जस्तै, तथ्याङ्क भन्नाले वास्तविकतामा आधारित अङ्क वा हिसाब वा गणितीय आधारमा प्रमाणित हुनसक्ने विवरण वा वस्तु जनाउँछ । लगत भन्नाले कुनैपनि कामका लागि चाहिने नगद जिन्सी वा मालसामानको जम्माजम्मी विवरणको सूची वा फेहरिस्त जनाउँछ । नेपाली भाषामा लगत र तथ्याङ्क फरक कुरा हुन् तर डाटा शब्दले दुवैलाई जनाउने गरिएको छ ।

विद्युतीय कारोबार ऐन २०६३ ले तथ्याङ्क भन्नाले कम्प्युटर वा कम्प्युटर प्रणाली वा कम्प्युटर नेटवर्कमा प्रशोधन गर्ने उद्देश्यले राखिएको, प्रशोधन गरिएको, कम्प्युटरको मेमोरीमा स्मरण गरिएको जुनसुकै सूचना तथ्यलाई जनाउँछ । नेपालमा भाषा मानकीकरणको व्यवस्था नभएको र जसरी भए पनि बुझे भइहाल्यो भन्ने मानसिकताले लगत, डाटा, तथ्याङ्क जे भएपनि यिनीहरू डाटा हुन् ।

सामान्य अवधारणामा डाटाले तथ्यलाई बुझाउँछ । डाटा अमूर्त विचारदेखि ठोस र मापन गर्न सकिने तथ्याङ्कसम्म पनि हुन सक्छ। डाटा मापन, सङ्कलन र विश्लेषण गरिन्छ अनि ग्राफ, तालिका वा चित्रहरूमा सङ्ग्रह गरिन्छ । आजको विद्युतीय जमानामा डाटा भनेको सूचना, ज्ञान वा बुद्धिका स्रोत हो । दैनन्दिन जीवनमा डाटालाई निर्णय गर्ने आधारवस्तुका रुपमा लिइन्छ ।

डाटा सूचना हो र सूचनाले दैनिक प्रयोगदेखि प्राविधिक प्रयोगसम्मका विभिन्न काममा महत्वपूर्ण भूमिका निर्बाह गरेको हुन्छ । आजकल डाटा लाइब्रेरी, डाटा सङ्ग्रह वा डाटा भण्डार गरेर दैनिक व्यवहारदेखि अनुसन्धानमा समेत प्रयोग गरिन्छ ।

आफ्नो देशको डाटा सरकारी कामकाजको भाषामा कम्प्युटरमा भूसांस्कृतिक वा भूस्थानीय (लोक्याल) जानकारी जडान गरेर विभिन्न प्रकारका कम्प्युटर प्रणालीहरूमा सूचना आदानप्रदान गर्दा फर्म्याट नबिग्रिने गरी वा विभिन्न अनुप्रयोगहरूले सजिलै बुझ्ने गरी मिलाइएको हुनुपर्छ ।

कम्प्युटिङ प्रणालीमा लोक्याल भनेको प्रयोगकर्ता देशको भाषा, क्षेत्र र प्रयोगकर्ताले आफ्नो इन्टरफेसमा स्थानीय पहिचान जनाउने भाषा, कोड, तिथि, मिति, देश वा क्षेत्र आदिको कोड हो जसले प्रविधि स्थानीयकरणलाई सरल बनाइदिन्छ । हामीकहाँ प्रविधि स्थानीयकरण वा प्रविधि आदान प्रदानको कुरा गरिन्छ, नियम बनाइन्छ तर सरकारी कामकाजको भाषामा डाटा राखेर नेपाली डाटा प्रशोधनलाई सजिलो बनाउने उपायबारे नीति निर्माता चुँसम्म पनि बोल्दैनन् । किनभने अङ्रेजी भाषाको मानक प्रयोग गरेर दातालाई रिझाउन पाए व्यक्तिगत लाभ हुन्छ ।

डाटाबेस व्यवस्थापन र सूचना संरचनामा डाटा बैंक वा डाटाभण्डार राख्ने तरिका व्यवस्थित गरिएको हुन्छ । सरकारले यसलाई कम्प्युटर प्रणालीमा व्यवस्थित नगरेपनि सबभन्दा बढी सूचना उत्पादन गर्ने निकाय भनेको सरकार वा सरकारी स्वामीत्व प्राप्त विभाग वा निकाय नै हुन् ।

नेपालको सबैभन्दा ठूलो डाटाबेस राख्ने सङ्गठित संस्था भनेको निर्वाचन आयोग, आन्तरिक राजस्व विभाग, भन्सार विभाग, कर्मचारी सञ्जय कोष, नागरिक लगानी कोष, राष्ट्रिय परिचयपत्र विभाग, अध्यागमन विभाग, राहदानी विभाग, कम्पनी रजिस्ट्रारको कार्यालय र राष्ट्रबैक लगायतका विभिन्न बैंक एवं सरकारी स्वामीत्वका संस्थाहरू हुन् । आइएनजिओले त डाटा उत्पादन गर्छन् तर उत्पादित डाटा आफ्नै देशतिर लैजान्छन् । कतिपय आइएनजिओ त डाटा सङ्कलनकै लागि नेपालमा काम गर्न आएका हुन्छन् ।

नेपालमा डाटाको व्यवस्थापन गरिएको वा भएको छैन । डाटा व्यवस्थापन नहुँदा सजिलै ह्याक हुने सम्भावना रहन्छ । ह्याक त के भन्नु हामी कहाँ सरकारी कार्यालयले नै सूचना विदेशी व्यक्ति र संस्थालाई उपलब्ध गराउँछन् । ह्याकिङ वा फिसिङ प्रविधिको दुरूपयोग हो  तर विना ह्याकिङ सरकारी कार्यालयको वेभसाइटबाट सूचना चुहाउनु वा पठाउनुलाई के भन्ने । नेपाल सरकारले संस्थागत जानकारी (इन्स्टिच्युसनल मेमोरी) को प्रयोग गर्दैन र डाटा पनि लुकाउँछ ।

सन् २००२ मा नेपाल सरकारले राष्ट्रिय भौगोलिक सूचना पूर्वाधार (NGII) कार्यक्रम लागु गर्‌यो । सन् २००८ देखि २०१० सम्म ५ विकास क्षेत्रको भौगोलिक नामको डाटाबेस निर्माण गर्यो । यो डाटाबेस नेपालीलाई उपलब्ध छैन तर सन् २०१० नोभेम्बर १ मा एनजिआइआइपिको मूल डाटाबेस संयुक्त राष्ट्र सङ्घ भौगोलिक नाम एक्स्पर्ट ग्रुपको कार्यालयमा स्थानान्तरण गरियो ( http://www.ngiip.gov.np/geographical.php) ।

संयुक्त राष्ट्र सङ्घ भौगोलिक नाम एक्स्पर्ट ग्रुपको निर्णय अनुसार भौगोलिक स्थाननामको नेपाली रोमन लिप्यन्तरणको मानक हेर्ने निकाय नापी विभाग हो । तर नापी विभागको रोमन नेपाली लिप्यन्तरणमा गल्ती भएकाले संयुक्त राष्ट्र सङ्घ भौगोलिक नाम एक्स्पर्ट ग्रुप नेपालका लागि हिन्दी रोमन लिप्यन्तरण विधि अपनाउछ किनभने हिन्दी पनि देवनागरी लिपि मै लेखिन्छ र नेपालीको भन्दा यो बढी तथ्यगत छ । (UNGEGN को रिपोर्ट चौथो संस्करण फेब्रुअरी २०१३) । अन्जिन संयुक्त राष्ट्र सङ्घको एकाइका रूपमा रहेको कार्यालयले सार्वभौम सम्पन्न देशको आधिकारिकतामा यसो भन्न नपाउनु पर्ने हो । नेपालमा कसले ध्यान दिने ? कानुनले गर्न हुन्न भनेको काम अपराध कार्य हो । यो पनि कानुन अनुसार नै त गरिएको होला !

डाटा पाइरेसी र साइबर अपराध दुबै गैरकानुनी कार्य हुन् । साइबर अपराधीलाई प्रत्यक्ष भेट्न सकिँदैन । स्वदेश विदेश जहाँसुकै हुनसक्छन् यस्ता मानिसहरू । त्यसैले डाटा पाइरेसी वा साइबर अपराधबाट बच्न डाटाको व्यवस्थित भण्डारण गर्नुपर्छ ।

डाटा चोरी वा डाटा पाइरेसी पनि डाटा इन्क्रिप्सन र भण्डारणका क्रममा गरिने कमजोरीका कारणबाट सिर्जित हुने कुरा हो । हामीकहाँ साइबर अपराध भनेर समग्र डिजिटल पाइरेसीका कुरालाई एकै ठाउँमा हालेर बुझ्ने चलन छ । साइबर अपराध भनेको नितान्त कानुनी अवधारणासँग सम्बन्धित छ भने डाटा पाइरेसी वा डिजिटल पाइरेसी डाटा भण्डारणका आन्तरिक कुरासँग बढी सम्बन्धित हुन्छ । आजकल डाटा पाइरेसीलाई अनलाइन पाइरेसी वा डिजिटल पाइरेसीका नामले पनि चिनिन्छ । साइबर क्राइम वा साइबर अपराध पनि डिजिटल पाइरेसी नै हो । जसरी वास्तविक संसारमा मानिसहरूले एकअर्काको नक्कल गरेर वस्तुको चोरी वा पुनर्उत्पादन गर्दछन् त्यसरी नै डिजिटल संसारमा डिजिटल सामग्रीको पाइरेटेड प्रतिलिपिहरू बनाएर वा चोरी गरेर वा नियम उल्लङ्घन गरेर त्यस्तो सामग्रीबाट अनधिकृत फाइदा लिन्छन् । डिजिटल सामग्रीमा सहज पहुँच हुन सक्दैन वा किन्नलाई महँगो हुन्छ । त्यसैले डिजिटल पाइरेसी डाटामा पहुँचका लागि राम्रो विकल्प बनेको देखिन्छ । डाटामा अनधिकृत पहुँचले हरेक व्यवसाय, उद्योग र राष्ट्रलाईनै असर पार्ने हुन्छ ।

डाटा चोरी वा पाइरेसीका विभिन्न कमजोर छिद्रहरू छन् । त्यस्ता छिद्रहरूमध्ये डाटा मानकीकरण नहुनु पनि एउटा मुख्य समस्या हो । डाटा मानकीकरणको अभावले भिन्न भिन्न डाटासेटहरूको संरचना बन्दछ र डाटा फर्म्याट रुपान्तरणमा समस्या पैदा गर्दछ । डाटा मानकीकरणले डाटाका प्रयोगकर्ताहरूलाई डाटाको प्रयोग, भण्डारण, विश्लेषण गर्न सजिलो बनाउँछ । जब डाटा उत्पादन वा सिर्जना गरिन्छ त्यसै बखत स्रोत प्रणालीमा यस्तो फर्म्याटमा उत्पादन गर्ने र यस्तो फर्म्याटमा भण्डारण गर्ने भन्ने तय हुन्छ । यसले गर्दा फरक फरक सर्जकहरूले सिर्जना गरेको डाटा विभिन्न इन्टरफेसमा नबिग्रने गरी देख्न सकिन्छ वा डाटा चलाउन कम्प्युटर अनुप्रयोगको अन्तर निर्भरता हटाउँछ र प्रशोधन र स्थानान्तरणमा पनि सहज हुन्छ ।

युरोपेली संघले यस्तो सहज परिवेश सिर्जना होस् भनी सामान्य डाटा संरक्षण विनियम २०१६ प्रयोग गर्दछ । युरोपेली सङ्घको डाटा १७ भन्दा बढी भाषाहरूमा संरक्षित हुन्छ । इयुमा सञ्चालन हुने प्रत्येक कमप्युटरलाई डाटा स्रोतहरूको अन्तरसञ्चालन क्षमतामा पहुँच दिनुपर्छ । डाटा आदान प्रदान गर्दा हानी नोक्सानी नहोस् भनेर इयुका हरेक संगठनले जिडिपिआर (सामान्य डाटा संरक्षण विनियम) का नियमहरूको पालना गर्नुपर्छ । नियम पालना नगरे जरिवाना तिर्नुपर्छ । नेपालमा त कम्प्युटर सञ्चालन सम्बन्धी मानकीकरण निकाय समेत छैन ।

डाटा इन्क्रिप्शनलाई गोपनीयता र संरक्षण प्रविधिको रूपमा लिइन्छ । डाटा इन्स्क्रिप्सनले प्रशोधन र भण्डारणमा सहज, मेसिनले सहजै पढ्नसक्ने र सजिलै विश्लेषण र पुन: प्रयोगमा सजिलो बनाउँछ । डाटा उत्पादन भण्डारण र संरक्षणका विभिन्न रणनीतिहरू हुन्छन् । डाटाको जीवनचक्र वा लाइफसाइकल हुन्छ । यसको व्यवस्थापन गर्न निश्चित मानक वा विधिको अवलम्बन गर्नुपर्छ । डाटाको पहुँच व्यवस्थापनमा विभिन्न नियन्त्रणहरू र कसैले अनधिकार पहुँच गर्न खोजेमा तुरुन्त सूचना प्रवाह हुने व्यवस्था गर्नुपर्छ । त्यसपछिमात्र साइबर अपराधका घटनाहरू बन्द गर्न, न्युन गर्न वा ह्याकर ट्र्याकिङ गर्न सहज हुन्छ । श्रोत: आइएनएस-स्वतन्त्र समाचार