Thursday, April 16, 2020

ITT UNIT 5

UNIT 5

प्रबंधन सूचना प्रणाली क्या है? (What is Management Information System)

प्रबंधन सूचना प्रणाली, एक सूचना प्रणाली है जिसका उपयोग कंपनी में निर्णय लेने के लिए किया जाता है, और एक संगठन में जानकारी के समन्वय, नियंत्रण, विश्लेषण किया जाता हैं| प्रबंधन सूचना प्रणाली का अध्ययन एक संगठनात्मक संदर्भ में लोगों और प्रौद्योगिकी की जांच करता है। प्रबंधन सूचना प्रणाली (MIS) एक कंप्यूटर प्रणाली है जिसमें हार्डवेयर और सॉफ्टवेयर शामिल होते हैं जो संगठन के संचालन की रीढ़ के रूप में कार्य करता है। एक MIS कई ऑनलाइन सिस्टम से डेटा इकट्ठा करता है, सूचना का विश्लेषण करता है, और प्रबंधन निर्णय लेने में सहायता के लिए डेटा रिपोर्ट करता है।
MIS का उद्देश्य बेहतर निर्णय लेना है, जिसमें विभिन्न संगठनात्मक संपत्तियों पर सटीक डेटा उपलब्ध है, जिसमें निम्नलिखित शामिल हैं:
  • Financials
  • Inventory
  • Personnel
  • Project timelines
  • Manufacturing
  • Real estate
  • Marketing
  • Raw materials
  • R&D
MIS डेटा एकत्र करता है, उसे संग्रहीत करता है, और उन प्रबंधकों के लिए इसे सुलभ बनाता है जो रिपोर्ट चलाकर डेटा का विश्लेषण करना चाहते हैं।

MIS की आवश्यकता (Needs of MIS)

  • निर्णय लेने वालों को प्रभावी निर्णय लेने के लिए जानकारी की आवश्यकता होती है। प्रबंधन सूचना प्रणाली (MIS) इसे संभव बनाती है।
  • एमआईएस सिस्टम संगठन के भीतर और बाहर संचार की सुविधा प्रदान करते हैं – संगठन के भीतर के कर्मचारी दिन-प्रतिदिन के कार्यों के लिए आवश्यक जानकारी तक आसानी से पहुंचने में सक्षम हैं।
  • रिकॉर्ड कीपिंग – प्रबंधन सूचना प्रणाली किसी संगठन के सभी व्यवसाय लेनदेन को रिकॉर्ड करती है और लेनदेन के लिए एक संदर्भ बिंदु प्रदान करती है।

MIS के घटक (Components of MIS)

एक विशिष्ट प्रबंधन सूचना प्रणाली के प्रमुख घटक हैं;
  • लोग (People) – जो लोग सूचना प्रणाली का उपयोग करते हैं|
  • डेटा (Data)- डेटा जिसे सूचना प्रणाली रिकॉर्ड करती है|
  • व्यावसायिक प्रक्रियाएं (Business Procedure)- डेटा को रिकॉर्ड करने, संग्रहीत करने और विश्लेषण करने के तरीके पर प्रक्रियाएं लागू होती हैं|
  • हार्डवेयर (Hardware)– इनमें सर्वर, वर्कस्टेशन, नेटवर्किंग उपकरण, प्रिंटर आदि शामिल हैं।
  • सॉफ्टवेयर (Software) – ये डेटा को संभालने के लिए उपयोग किए जाने वाले प्रोग्राम हैं। इनमें स्प्रेडशीट प्रोग्राम, डेटाबेस सॉफ्टवेयर आदि जैसे प्रोग्राम शामिल हैं।

सूचना प्रणाली के प्रकार (Types of Information Systems)

उपयोगकर्ता द्वारा उपयोग की जाने वाली सूचना प्रणाली का प्रकार किसी संगठन में उनके स्तर पर निर्भर करता है। निम्नलिखित आरेख एक संगठन में उपयोगकर्ताओं के तीन प्रमुख स्तरों और सूचना प्रणाली के प्रकार को दिखाता है जो वे उपयोग करते हैं।
Transaction Processing Systems (TPS) (लेनदेन प्रसंस्करण प्रणाली)
इस प्रकार की सूचना प्रणाली का उपयोग किसी व्यवसाय के दैनिक लेनदेन को रिकॉर्ड करने के लिए किया जाता है। एक ट्रांजेक्शन प्रोसेसिंग सिस्टम का एक उदाहरण प्वाइंट ऑफ़ सेल (POS) सिस्टम है। पीओएस सिस्टम का उपयोग दैनिक बिक्री को रिकॉर्ड करने के लिए किया जाता है।
Management Information Systems (MIS) (प्रबंधन सूचना प्रणाली)
प्रबंधन सूचना प्रणाली का उपयोग अर्ध-संरचित निर्णय लेने के लिए रणनीति प्रबंधकों को मार्गदर्शन करने के लिए किया जाता है। लेनदेन प्रसंस्करण प्रणाली से आउटपुट का उपयोग एमआईएस सिस्टम के इनपुट के रूप में किया जाता है।
Decision Support Systems (DSS) (निर्णय समर्थन प्रणाली)
शीर्ष-स्तरीय प्रबंधकों द्वारा अर्ध-संरचित निर्णय लेने के लिए निर्णय समर्थन प्रणाली का उपयोग किया जाता है। प्रबंधन सूचना प्रणाली से आउटपुट का उपयोग निर्णय समर्थन प्रणाली के इनपुट के रूप में किया जाता है। डीएसएस सिस्टम बाहरी स्रोतों से डेटा इनपुट भी प्राप्त करते हैं जैसे कि वर्तमान बाजार बलों, प्रतियोगिता, आदि।

System Development Life Cycle

SDLC का पूरा नाम System development life cycle है । SDLC एक सूचना प्रणाली (Information system) के जीवन चक्र (life cycle) की व्याख़्या करता है। डेटाबेस डिज़ाइन SDLC का एक मूलभूत घटक है। किसी भी सिस्टम को बनाने में जो प्रक्रिया होती है उस प्रक्रिया को System development life cycle (SDLC) कहते है।
Image result for system development life cycle
सिस्टम डेवलपमेंट एक birth to mature प्रोसेस है किसी सिस्टम को बनाने के निम्न चरण होते है।
  • Preliminary investigation
  • Feasibility Study
  • Requirement Analysis
  • System Analysis
  • System design
  • Software Development
  • Testing
  • Implementation
  • Maintenance
  • Review
1. Preliminary investigation:- सिस्टम डेवलपमेंट लाइफ साइकिल का पहला चरण सिस्टम की वास्तविक समस्या का पता लगाना है सिस्टम में प्रॉब्लम को जाने बिना आगे कोई भी काम करना प्रयास को निष्फल करना है | किसी भी सिस्टम में समस्या यूजर की आवश्यकताओं को परिभाषित करती है | इस चरण में सिस्टम एनालिस्ट समस्या का पता लगाता है सिस्टम से हमें क्या पाना है या उसके क्या लक्ष्य है डिस्कस करते है। इस चरण में हम यह देखते है कि जो वर्तमान सिस्टम है वह अपना काम सही तरीके से कर रहा है या नही। अगर वह सही तरीके से अपना काम कर रहा है तो उसे बदलने की कोई जरूरत नही है।
2. Feasibility Study:-फिजिबिलिटी स्टडी के अंतर्गत मौजूदा सिस्टम (Existing System) में थोडा सुधार करना है या पूरी तरह से नए सिस्टम का विकास करना है,इस बात पर विचार किया जाता है| फिजिबिलिटी स्टडी समस्या के ओवरव्यू को समझने में मदद करती है| फिजिबिलिटी स्टडी यह सुनिश्चित करने के लिए की जाती है ,की प्रोजेक्ट को आगे बढ़ाना है ,या पोस्टपोन करना है या केंसिल करना है |
3. System Analysis:- सिस्टम एनालिसिस सिस्टम डेवलपमेंट लाइफ साइकिल का सबसे महत्वपूर्ण चरण है |पहले चरण में समस्या को परिभाषित किया जाता है, तथा इस चरण में उन समस्याओ की और अधिक अधिक गहराई के साथ जांच की जाती है। इस चरण में यूजर की आवश्यकताओं को देखा जाता है, कि end users की क्या-क्या जरूरतें है। इस चरण में सिस्टम के हार्डवेयर और सॉफ्टवेयर का अच्छी तरह से अध्यन किया जाता है। इसमें end users तथा डिजाईनर दोनों मिलके समस्याओ को हल करते है।
4. System design:- इस चरण में डिज़ाइनर सिस्टम के प्रोसेस के डिज़ाइन को पूरा करता है। सिस्टम में सम्पूर्ण तकनीकी निर्देश (technical specifications) को शामिल किया जाता है जिससे सिस्टम और भी ज्यादा इंटरैक्टिव तथा कुशल बन जाएँ।
5. Software Development:-सिस्टम डिजाईन करने के बाद सॉफ्टवेयर या प्रोग्राम बनाना SDLC का अगला चरण है |डेवलपमेंट वह चरण है जहाँ सिस्टम डिजाईन के अनुसार प्रोग्रामर प्रोग्रामकी कोडिंग करता है  अर्थात  इस चरण में सिस्टम वास्तविक रूप में परिवर्तित होता है|
7.Testing:-इस चरण में सिस्टम की टेस्टिंग की जाती है  इससे पहले की डेटाबेस डिज़ाइन को इम्प्लीमेंट किया जाएं सिस्टम को  टेस्टिंग,कोडिंग, तथा debugging प्रोसेस से होकर गुजरना पड़ता है। SDLC में यह सबसे लम्बे समय तक चलने वाला चरण  है।
6. Implementation:- इस चरण में, हार्डवेयर, DBMS सॉफ्टवेयर तथा एप्लीकेशन प्रोग्राम्स को इन्स्टाल किया जाता है तथा डेटाबेस डिज़ाइन को इम्प्लीमेंट किया जाता है।
7. Maintenance:-  जब सिस्टम बनके तैयार हो जाता है तथा यूजर उसका प्रयोग करना शुरू कर देते है तब जो भी समस्या उसमें आती है उनको समय-समय पर हल करना पड़ता है। तैयार सिस्टम का  समय के अनुसार ख्याल रखना ही मेंटेनेंस कहलाता है।
8.Review:-जब सिस्टम को इम्प्लीमेंट कर दिया जाता है तब यूजर से उसके बारे में रिव्यु लिए जाते की सिस्टम यूजर की आवश्यकताओं को पूरा करने में सक्षम है या नहीं |

Initial Investigation

System development life cycle का पहला चरण आवश्यकताओं का पता लगाना  है | सिस्टम में बदलाव, उपस्थित सिस्टम में वृद्धि प्रयोगकर्ता की मांग होती है | प्रारंभिक परीक्षण प्रयोगकर्ता की आवश्यकताओं को जानने की एक मानक रूपरेखा है जिसका उद्देश्य यह जानना है की प्रयोगकर्ता की मांग उपयुक्त और संभव है या नहीं |
प्रयोगकर्ता का मांगपत्र निम्न जानकारी प्रस्तुत करता है-
  • प्रयोगार्थी द्वारा कार्य को दिया गया मुख्यप्रष्ठ
  • कार्य का तरीका
  • कार्य दिए जाने की तिथि
  • कार्य पूर्ण होने की तिथि
  • कार्य का उद्देश्य
  • इनपुट /आउटपुट का वर्णन
  • मांगने वाले का नाम ,संकाय ,फ़ोन नंबर और हस्ताक्षर
  • स्वीकृत करने वाले व्यक्ति का नाम हस्ताक्षर संकाय और फ़ोन नंबर प्रयोगकर्ता की मांग बदलाव की आवश्यकता को प्रस्तुत करता है
अंतिम लिखित वचनबद्धता के पहले कई बदलावों की आवश्यकताओं होती है | मांग की स्वीकृति के बाद बैकराउंड टेस्टिंग ,फैक्ट फाइंडिंग एनालिसिस और परिणाम का प्रस्तुतिकरण जैसे कार्य किये जाते है ,जिन्हें प्रोजेक्ट प्रपोजल कहते है | प्रपोजल की स्वीकृति के बाद सिस्टम क्वालिटी का प्रयोगकर्ता द्वारा निर्धारित विशिष्ट वर्णन और सिस्टम की संभावना का विश्लेषण प्रारंभ होता है |

फैक्ट फाइंडिंग तकनीक क्या होती है?



फैक्ट फाइंडिंग तकनीक डाटा और सूचना के संग्रह की प्रक्रिया है जिसमें मौजूदा दस्तावेजों, शोध, अवलोकन, प्रश्नावली, साक्षात्कार, प्रोटोटाइप का प्रयोग किया जाता है। सिस्टम विश्लेषक मौजूदा सिस्टम को विकसित और कार्यान्वित करने के लिए उपयुक्त तथ्य-खोज तकनीकों (Fact finding techniques) का उपयोग करता है। फैक्ट-फाइंडिंग तकनीकों का उपयोग सिस्टम डेवलपमेंट लाइफ साइकिल के शुरुआती चरण में किया जाता है जिसमें सिस्टम विश्लेषण चरण, डिज़ाइन और इसके प्रयोग में लग जाने के बाद की समीक्षा शामिल है।


जब किसी सिस्टम को डेवेलप किया जाना होता है, तो पहले उस सिस्टम के बारे में बहुत सी जानकारी एकत्रित करनी होती है, जिससे उस सिस्टम का SRS (Software Requirements Specification) डॉक्यूमेंट तैयार किया जा सके| इस डॉक्यूमेंट में विकसित किये जाने वाले सिस्टम या सॉफ्टवेयर के इच्छित उद्देश्य और व्यवहार का पूर्ण विवरण होता है| इस डॉक्यूमेंट से ये भी पता चलता है कि सिस्टम क्या काम करेगा और इसका प्रदर्शन कैसा रहेगा| तो यदि हम चाहते हैं की हमारे सिस्टम का SRS डॉक्यूमेंट अच्छा बने तो हमें तथ्य खोजने की विभिन्न तकनीकों का बेहतर ढंग से प्रयोग करना पड़ेगा|

तथ्य खोजने की तकनीक (Fact finding techniques)

मौजूदा दस्तावेजों की समीक्षा करना (Review of Records, Procedures, and Forms)
साक्षात्कार (interview)
प्रश्नावली (questionnaire)
ऑनसाइट अवलोकन (onsite observation)
मौजूदा दस्तावेजों की समीक्षा करना


सिस्टम और संगठन से संबंधित जानकारी पहले से ही कुछ प्रकार के दस्तावेजों और रिकॉर्ड (जैसे सिस्टम यूजर मैनुअल, सिस्टम रिव्यू / ऑडिट, ब्रोशर आदि) में उपलब्ध होती है, या समाचार पत्रों, पत्रिकाओं, पत्रिकाओं आदि जैसे स्रोतों में प्रकाशित होती है। पहले से उपलब्ध दस्तावेज का अध्ययन, तथ्य और जानकारी इकट्ठा करने का सबसे तेज़ और स्वतंत्र तरीका होता है, जिसके आधार पर विश्लेषक आगे के अभ्यास के लिए प्रश्न तैयार कर सकते हैं।

मौजूदा दस्तावेजों की समीक्षा करने के लाभ

यह उपयोगकर्ताओं को संगठन या संचालन के बारे में कुछ ज्ञान प्राप्त करने में मदद करता है|
यह कम से कम समय में वर्तमान प्रक्रिया के प्रारूप और कार्यों का वर्णन करने के लिए सबसे अच्छा तरीका है क्यूंकि किसी भी उपयोगकर्ता के कार्यों के बारे में इनमे पहले से ही सही जानकारी लिखी होती है।
यह संगठन में किये गए लेनदेन, प्रोसेसिंग के लिए इनपुट की पहचान और प्रदर्शन का मूल्यांकन करने के बारे में एक स्पष्ट समझ प्रदान कर सकता है।
यह एक विश्लेषक को संचालन के संदर्भ में प्रणाली को समझने में मदद कर सकता है|
यह समस्या, इसके प्रभावित भागों और प्रस्तावित समाधान का वर्णन करता है।

साक्षात्कार (interview)



इस विधि का उपयोग समूहों या व्यक्तियों से जानकारी एकत्रित करने के लिए किया जाती है। विश्लेषक उन लोगों का चयन करता है जो साक्षात्कार के लिए सिस्टम से संबंधित हैं। इस पद्धति में विश्लेषक लोगों के साथ आमने-सामने बैठता है और उनकी प्रतिक्रियाओं को रिकॉर्ड करता है जिसके द्वारा विश्लेषक मौजूदा प्रणाली, उसकी समस्या और प्रणाली के बारे में सीखते हैं। साक्षात्कार कर्ता को पहले से ही इस प्रकार के प्रश्नों की योजना बनानी चाहिए जो वह पूछने जा रहा है और किसी भी प्रकार के प्रश्न का उत्तर देने के लिए तैयार होना चाहिए।


इंटरव्यू के द्वारा एकत्रित की गई जानकारी काफी सटीक और विश्वसनीय होती है, क्योंकि इसमें साक्षात्कार कर्ता स्वयं वहां मौजूद होता है और किसी संदेह की स्थिति में तुरंत नयी जानकारी प्राप्त कर सकता है। यह विधि गलतफहमी के क्षेत्रों को दूर करने और भविष्य की समस्याओं के बारे में चर्चा करने में मदद करती है।
इंटरव्यू के दो प्रकार हो सकते हैं


असंरचित साक्षात्कार (Unstructured Interview) – सिस्टम एनालिस्ट सिस्टम की बेसिक जानकारी हासिल करने के लिए सवाल-जवाब बैठक आयोजित करता है।


संरचित साक्षात्कार (Structured Interview) – इसमें मानक प्रश्न होते हैं जिसके अंतर्गत उपयोगकर्ता को वर्णनात्मक या ऑब्जेक्टिव प्रारूप में जवाब देने की आवश्यकता होती है। जिसे हम ओपन सेशन और क्लोज सेशन भी बोल सकते हैं|

साक्षात्कार के लाभ
यह विधि अक्सर विशिष्ट जानकारी इकट्ठा करने का सबसे अच्छा स्रोत है।
यह उनके लिए उपयोगी है, जो लिखित रूप में प्रभावी ढंग से संवाद नहीं कर पाते हैं या जिनके पास प्रश्नावली को पूरा करने का समय नहीं है।
जानकारी को आसानी से मान्य किया जा सकता है और तुरंत क्रॉस चेक किया जा सकता है।
इसके जरिये जटिल विषयों के बारे में भी जानकारी प्राप्त की जा सकती है|
किसी की राय मांगकर महत्वपूर्ण समस्या का पता लगाना आसान होता है।
यह गलतफहमी को कम करता है और भविष्य में होने वाली समस्याओं को कम करता है।

प्रश्नावली (questionnaire)



इस विधि के जरिये लिखित और निर्धारित प्रारूप में व्यक्ति से जानकारी मांगी जाती है। यह जानकारी इकट्ठा करने का एक तेज़ तरीका है यदि उत्तरदाता भौगोलिक रूप से अलग अलग जगह पर हैं या साक्षात्कार के लिए ज्यादा समय नहीं है। इसके अंतर्गत प्रश्न किसी भी प्रकार के हो सकते हैं: संरचित या असंरचित। संरचित प्रश्न में उत्तर YES / NO के रूप में, कई विकल्पों में से एक विकल्प का चयन, रेटिंग, रिक्त स्थान आदि के रूप में हो सकते हैं| वहीँ असंरचित प्रश्न में किस व्यक्ति से उसकी राय पूछी जा सकती है और वह स्वतंत्र रूप से इसका उत्तर दे सकता है।
प्रश्नावली के लाभ
यह उपयोगकर्ताओं के हितों, दृष्टिकोण, भावनाओं और विश्वास के सर्वेक्षण में बहुत प्रभावी है जो सह-स्थित नहीं हैं।
किसी स्थिति में यह जानना उपयोगी है कि दिए गए समूह के किस अनुपात में प्रस्तावित प्रणाली की किसी विशेषता का अनुमोदन या अस्वीकृति है।
सिस्टम प्रोजेक्ट को कोई विशिष्ट दिशा देने से पहले समग्र राय निर्धारित करना उपयोगी होती है।
यह अधिक विश्वसनीय होता है क्यूंकि इसमें उत्तरदाताओं की ईमानदार प्रतिक्रियाओं की उच्च गोपनीयता होती है।
यह तथ्यात्मक जानकारी का चुनाव करने और सांख्यिकीय डेटा संग्रह के लिए उपयुक्त है जिसे ईमेल और डाक द्वारा भेजा जा सकता है।

ऑनसाइट अवलोकन (onsite observation)



इस तकनीक में, विश्लेषक संगठन में भाग लेता है, दस्तावेजों के प्रवाह का अध्ययन करता है, मौजूदा प्रणाली को लागू करता है, और उपयोगकर्ताओं के साथ बातचीत करता है। अवलोकन एक उपयोगी तकनीक हो सकती है क्यूंकि इसमें विश्लेषक उपयोगकर्ता के दृष्टिकोण को समझ पाता है। इस तकनीक का उपयोग करके, सिस्टम विश्लेषक यह जान सकते हैं कि कर्मचारी अपना दिन किन किन कार्यों की करने में बिताते हैं।
ऑनसाइट अवलोकन के लाभ
यह जानकारी प्राप्त करने का एक सीधा तरीका है।
यह उस स्थिति में उपयोगी है जहां एकत्र किए गए डेटा की प्रामाणिकता सवाल में है या जब सिस्टम के कुछ पहलुओं की जटिलता उपयोगकर्ताओं द्वारा अच्छे से स्पष्ट नहीं की जा पा रही है।
यह अधिक सटीक और विश्वसनीय डाटा का उत्पादन करता है।

Data Analysis



लागत लाभ विश्लेषण (cost benefit analysis) के लिए डाटा विश्लेषण आवश्यक है | सिस्टम की जांच-पड़ताल तथा डाटा संग्रहण वर्तमान उपलब्धियों का आंकलन होता है | हमारी रूचि यह पता करने में है की कैसे कुछ कदम पूरी कार्यकुशलता के साथ संपन्न किये जाते है, कैसे वे वांछित लक्ष्यों की प्राप्ति में मदद कर सकते है तथा कैसे निर्माण की लागत सुधारी जा सकती है | डेटा विश्लेषण निर्णय को अधिक वैज्ञानिक बनाने और व्यवसाय को प्रभावी संचालन करने में मदद करता है। इसका उपयोग विभिन्न व्यवसाय, विज्ञान और सामाजिक विज्ञान डोमेन में किया जा रहा है।


विश्लेषण से सिस्टम डिजाईन संबंधी आवश्यकताओं को पहचाना जाता है| आवश्यक सुधार करने के लिए कैंडिडेट सिस्टम में इन फीचर को शामिल किया जाना चाहिए |


सिस्टम की आवश्यकताए निम्नाकित है –

• बेहतर ग्राहक सेवा |

• सूचना को फिर से प्राप्त करने की तीव्र गति |

• नोटिस की त्वरित तैयारी |

• बिलिंग की बेहतर विशुद्धता |

• प्रोसेसिंग और ऑपरेटिंग में सुधार|

• स्टाफ की कार्यकुशलता में सुधार |

• त्रुटियाँ हटाने के लिए ससंगत बिलिंग प्रक्रिया |


डिजाईन सम्बन्धी इन उद्देश्यों को प्राप्त करने के लिए विभिन्न विकल्पों का पता करना होगा | यदि साधारणतः एक से अधिक विकल्प हो | एनालिस्ट उनमे से केवल उनका चयन करता है जो आर्थिक, तकनीकी और संचालन की द्रष्टि से उपयुक्त होते है | प्रत्येक विधि के अपने लाभ और नुकसान है |

Process of Data Analysis

Data requirements

डेटा विश्लेषण के लिए इनपुट के रूप में आवश्यक हैं, जो विश्लेषक या ग्राहकों (जो विश्लेषण के तैयार उत्पाद का उपयोग करेंगे) की आवश्यकताओं के आधार पर बनाया जाता है।

Data collection

विभिन्न स्रोतों से डेटा एकत्र किया जाता है।
डेटा को विभिन्न सेंसर के माध्यम से भी एकत्र किया जा सकता है, जैसे ट्रैफ़िक कैमरा, उपग्रह, रिकॉर्डिंग डिवाइस आदि।
यह इंटरव्यू, ऑनलाइन डाउनलोड, प्रश्नावली के माध्यम से भी प्राप्त किया जा सकता है|

Data processing

प्रारंभ में प्राप्त डेटा को विश्लेषण के लिए संसाधित या व्यवस्थित किया जाना चाहिए। उदाहरण के लिए, प्राप्त डाटा को टेबल के रूप में रखा जा सकता है जिसके लिए विभिन्न स्प्रेडशीट या डेटाबेस मैनेजमेंट सॉफ्टवेर का प्रयोग किया जा सकता है|

Data cleaning

एक बार संसाधित और व्यवस्थित होने के बाद, डाटा अधूरा, डुप्लिकेट या उसमे त्रुटियां हो सकती हैं।
Data cleaning इन त्रुटियों को रोकने और ठीक करने की प्रक्रिया है। सामान्य कार्यों में शामिल हैं

रिकॉर्ड मिलान (record matching)

डेटा की सटीकता की पहचान करना (identifying accuracy of data)
मौजूदा डेटा की समग्र गुणवत्ता (overall quality of existing data)
डिडुप्लीकेशन (de-duplication) – इसके अंतर्गत डाटा में से डुप्लीकेट डाटा को अलग किया जाता है|

डाटा को कॉलम में विभाजन (column segmentation)

Exploratory data analysis एक बार डाटा स्पस्ट या डाटा के clean हो जाने के बाद, इसका विश्लेषण किया जा सकता है।
विश्लेषक डेटा में निहित संदेशों को समझने के लिए डेटा विश्लेषण के रूप में विभिन्न तकनीकों का प्रयोग कर सकता है।
Modeling and algorithms गणितीय सूत्र या मॉडल जिसे एल्गोरिदम कहा जाता है, एल्गोरिदम को चर (variable) के बीच संबंधों की पहचान करने के लिए डेटा पर लागू किया जा सकता है।
Data product डाटा उत्पाद एक कंप्यूटर अनुप्रयोग है जो डाटा को इनपुट के रूप में लेता है और आउटपुट उत्पन्न करता है।
यह एक मॉडल या एल्गोरिथ्म पर आधारित हो सकता है।
उदाहरण के लिए कोई एक एप्लीकेशन कस्टमर की पुरानी खरीदों का विश्लेषण करता है और उन्हें उनके जरूरतों के आधार पर नए प्रोडक्ट दिखता है|
Communication
एक बार डाटा का विश्लेषण हो जाने के, उपयोगकर्ताओं को उनकी आवश्यकताओं के आधार पर कई स्वरूपों में प्रस्तुत किया जा सकता है। उपयोगकर्ताओं की प्रतिक्रिया के अनुसार इसे दुबारा अतिरिक्त विश्लेषण के लिए भेजा जा सकता है।
विश्लेषक उपयोगकर्ताओं को डाटा को स्पष्ट रूप से और कुशलता से संवाद करने के लिए विभिन्न डाटा विज़ुअलाइज़ेशन तकनीकों का प्रयोग कर सकता है। जैसे चार्ट, टेबल इत्यादी

Data Dictionary
DBMS के अंतर्गत Data dictionary एक फ़ाइल या फाइलों का समूह होती है जो कि डेटाबेस के मेटाडाटा (metadata) को store करती है। Data Dictionary में वास्तविक डेटा नहीं होता है, बल्कि यह सिर्फ डेटा को प्रबंधित करने के लिए बहीखातों के रूप में सूचना (जैसे-टेबल का नाम तथा विवरण आदि) को स्टोर करती है।

Data flow diagram में Data Store, Data destination, Process तथा इनके मध्य होने वाले Data flow को हम नाम तो देते है| लेकिन सिर्फ नाम देने से डाटा के विवरण के बारे में जानकारी प्राप्त नही होती है | ऐसी स्थिति में हमे एक ऐसी संरचनात्मक फाइल की आवश्यकता होती है, जहां इनफार्मेशन सिस्टम में उपस्थित प्रत्येक डाटा संबंधी जानकारी स्टोर करके रख सके, ताकि आवश्यकता पड़ने पर वह जानकारी पुनः प्राप्त की जा सके Data Dictionary एक ऐसा ही Structured group है जहां इनफार्मेशनसिस्टम के समस्त डाटा अवयव की जानकारी स्टोर करके रखी जाती है | दूसरे शब्दों में कहे तो डाटा डिक्शनरी में डाटा स्टोर किया जाता है जिसे तकनीकी भाषा में Meta data कहा जाता है |
Data dictionary के प्रकार Active data dictionary वह data dictionary जो कि हर समय अपने आप ही DBMS के द्वारा update हो जाती है, Active data dictionary कहलाती है।
Passive data dictionary Passive data dictionary भी active data dictionary के समान होती है परन्तु इसमें यह DBMS के द्वारा स्वतः update नहीं होती है।
डाटा डिक्शनरी में उपलब्ध जानकारी
सभी डेटाबेस तालिकाओं और उनके स्कीमा के नाम।
डेटाबेस में सभी तालिकाओं के बारे में विवरण, जैसे उनके अधिकृत उपयोगकर्ता, उनकी सुरक्षा सम्बंधित जानकारी, बनाये जाने की जानकारी
तालिकाओं के बारे में भौतिक जानकारी जैसे कि वे कहाँ संग्रहीत हैं और कैसे।
टेबल के अनतर्गत प्राइमरी और फॉरेन key की जानकारी
डेटाबेस के व्यूज (Views) के बारे में जानकारी

Structured English
Structured English Structured Programming पर आधारित है| इसमें वाक्यों की तार्किक बनावट के आधार पर सूचनाये प्राप्त की जाती है | इसमें निर्देशों को देने के लिए एक विशेष व्याकरण होता है | जिसका प्रयोग डाटा के साथ किया जाता है | इसमें किसी भी प्रोसेस को साधारण अंग्रेजी भाषा में कोड किया जाता है |


इसे हम एक उदाहरण से समझ सकते है अगर टोटल 33 से कम होगा तो फ़ैल |इसे Structured English में निम्नानुसार लिखेगे |


Example:

If total is less than 33
Then fail

Decision Tree Decision Tree एक ऐसा स्ट्रक्चर है,जिसके द्वारा डाटा पर लागू होने वाली शर्ते तथा उन शर्तो के आधार पर लिए गए डिसिजन को प्रदर्शित किया जाता|
Decision Tree वर्गीकरण और भविष्यवाणी के लिए सबसे शक्तिशाली और लोकप्रिय टूल है।
यह एक data visualization का तरीका है|
एक Decision tree का प्रयोग Decision making के लिए किया जाता है।
Decision tree एक फ्लो-चार्ट की तरह का स्ट्रक्चर होता है; जिस प्रकार tree में पत्तियाँ, जड़ तथा शाखाएँ होती है उसी प्रकार इसमें leaf नोड तथा branches होती है।
Decision tree में सबसे ऊपर की नोड को root नोड कहते है इसमें प्रत्येक leaf नोड एक class को प्रदर्शित करती है।


Decision Tree को समझने के लिए हम निम्न उदाहरण लेते है, एक साड़ी निर्माता कंपनी अपने ग्राहकों के लिए डिस्काउंट पालिसी को लागू करती है,इस डिस्काउंट पालिसी के अनुसार साड़ी निर्माता अपने ग्राहकों को उनके प्रकार एवं आर्डर की मात्रा के आधार पर डिस्काउंट देती है |






Advantage of Decision Tree

इसके लिए किसी भी डोमेन ज्ञान की आवश्यकता नहीं है।
समझने में यह बहुत आसान होता है।
डिसिशन ट्री के सीखने और वर्गीकरण के चरण सरल और तेज होते हैं।

Decision Table

यह एक टूल है जिसका प्रयोग परीक्षण और आवश्यकताओं के प्रबंधन के लिए किया जाता है|
सामान्यतः इसका प्रयोग जटिल व्यावसायिक नियमों से निपटने हेतु आवश्यकताओं को तैयार करने के लिए किया जा सकता है।
इसके जरिये यह देखना आसान हो जाता है कि शर्तों के सभी संभावित संयोजनों (Combination of conditions) पर विचार किया गया है और की अगर किसी शर्त को छोड़ दिया गया है।


यदि प्रक्रिया जटिल हो व कई कंडीशनल निर्णय लेने हो तब डिसिजन टेबल का उपयोग किया जाता है| डिसिजन टेबल में कंप्यूटर प्रोसेस के दौरान आने वाली सभी कंडीशन और एक्शन को व्यक्त किया जाता है |


डिसिजन टेबल को निम्न चार भागो में विभक्त किया जा सकता है-

Condition Stub- यह डिसिजन टेबल में सबसे ऊपर बाए कोने में स्थित होता है | इसमें उन सभी condition की list होती है , जिन्हें कंप्यूटर प्रोसेस के दौरान शामिल करना है |
Condition Entry – यह डिसिजन टेबल में ऊपर ,दाए कोने में कंडीशन स्टब के सामने स्थित होता है ,इसमें कंडीशन की संतुष्टि असंतुष्टि का स्वरुप अंकित किया जाता है |
Action Stub – यह डिसिजन टेबल में नीचे , बायीं तरफ कंडीशन स्टब के ठीक नीचे स्थित होती है| इसमें उन सभी action की list होती है ,जो की कंप्यूटर प्रोसेस के दौरान आवश्यकता पड़ने पर किए जा सकते है |
Action Entry- यह डिसिजन टेबल में नीचे ,दाई तरफ Condition entry के नीचे होता है इसमें कंडीशन के आधार पर क्या action करना है इसकी एंट्री होती है |



ATM Decision Table


इस उदाहरण में अगर एक ग्राहक एटीएम के जरिये अपने बैंक अकाउंट से पैसे निकलना चाहता है नियम कुछ इस तरह से हो सकते हैं|
ग्राहक के अकाउंट में बैलेंस निकालने वाले अमाउंट से ज्यादा है
अगर बैलेंस कम है और ग्राहक को उधार की सुविधा दी गयी है


इन दोनों शर्तों में ग्राहक को एटीएम से पैसे मिल जायेंगे| इन्ही शर्तों के लिए ये डिसिशन टेबल बनाई जा सकती है



No comments:

Computer Terms

The termination of the process due to a program or system fault      -      Abend(abnormal ending) To terminate a process before completion....