विचार
डाटा न समझ पाने वाला मीडिया कोविड विश्लेषण के नाम पर झूठ और भ्रम फैला रहा है

कोविड मौतों के आँकड़ों का मूल्यांकन करते हुए मैंने शोध में पाया कि मीडिया जो विश्लेषण करता है, उसमें कई त्रुटियाँ हैं। मैं उनके उपाख्यानमूलक दावों की बात नहीं कर रहा हूँ जो प्रायः विरोधाभासी होते हैं।

जब वे सही डाटा का भी उपयोग करते हैं, तब भी सांख्यिकी विश्लेषण खराब और भ्रमित करने वाला होता है। कुछ लेखों में बाहरी विशेषज्ञों की सहायता के बावजूद भी सही विश्लेषण नहीं दिख पाता। मैं यहाँ कुछ बिंदु बता रहा हूँ जिसका पाठक ध्यान रखें और भ्रमित न हों।

1. सिर्फ संख्या

“गुजरात में 40,000 तो दिल्ली में 11,000 अतिरिक्त मौतें” कुछ इसी प्रकार की सुर्खियाँ हैं। भले ही ये आँकड़े सही हैं लेकिन सही रूपरेखा के बिना अर्थहीन रह जाते हैं।

40,000 का आँकड़ा 11,000 से बेहतर है यदि वह 7 करोड़ लोगों की जनसंख्या में दो माह का आँकड़ा है, जबकि दूसरा आँकड़ा 1.9 करोड़ की जनसंख्या में एक महीने की अवधि का है। सही सांख्यिकी वह होती है जिसमें संदर्भ के साथ आँकड़े दिए हों और समान चीज़ों की तुलना करते हों।

2. अवशिष्ट अति संवेदनशील होते हैं

अतिरिक्त मौतें एक अवशिष्ट है यानी (अ) में से (ब) को घटाकर यह आँकड़ा मिला है। यदि (अ) एक ज्ञात संख्या है और (ब) एक अनुमान जो किसी आधार रेखा के आधार पर लगाया गया है तो इस आधार रेखा में थोड़ा-सा परिवर्तन अतिरिक्त मौतों में काफी अंतर ला सकता है।

आधार रेखा को ध्यान से बनाना चाहिए जिसका विस्तृत तरीका पारदर्शी हो। अधिकांश अध्ययनों में आधार रेखा को तर्क की बजाय एजेंडा के आधार पर चुना जाता है।

3. आधार रेखा को काफी नीचे रखना

एक सनसनीखेज़ समाचार बनाने के लिए अत्यधिक मौतों का आँकड़ा चाहिए जिसे प्राप्त करने का सबसे सरल मार्ग है कि आधार रेखा को कम रखा जाए। कई रिपोर्टों में 2015-19 के औसत का उपयोग जनसंख्या के अनुसार परिवर्तन किए बिना किया गया है।

यदि वे जनसंख्या के अनुसार परिवर्तन कर देंगे या हाल के वर्ष को आधार रेखा बनाएँगे तो अत्यधिक मौतें कम होंगी इसलिए वे ऐसा नहीं करते हैं। उद्देश्य होता है कि सबसे विश्वसनीय नहीं, बल्कि सबसे सरल आधार रेखा बनाई जाए।

4. औसतों की निरंकुशता

मीडिया प्रत्येक वर्ष का डाटा छुपाती है और बस औसत दर्शाती है। कोविड से पहले जिन वर्षों में अत्यधिक मौतें हुईं थी, उन्हें छुपा दिया जाता है ताकि हम यह समझ नहीं पाएँ कि मृत्यु के डाटा में छोटी-मोटी उछाल सामान्य है।

यदि हम पाँच वर्षों का औसत लेकर ही चल रहे हैं तो बेहतर होगा कि सभी डाटा (आंतरिक ट्रेंड और हर वर्ष का औसत) दिखाया जाए। यह डाटा जितना कम छुपाया जाएगा, विश्लेषण उतना ठोस होगा।

5. विसंगतियों से भरा आंतरिक डाटा

गुजरात के डाटा में विभिन्न शहरों में काफी अंतर था। जैसा डाटा में दर्शाया गया, यदि वैसा बुरा हाल राजकोट का था तो हमें आवश्यकता नहीं पड़ती कि यह बात कोई पत्रकार या विश्लेषक आकर हमें बताए।

युवाओं के बीच मौतों में वृद्धि देखी गई जो कि कोविड-ट्रेंड के अनुरूप नहीं है। जो एजेंडा पर उपयुक्त बैठ रहा हो उसे लेकर रेखांकित कर देने और जो न बैठे उसे अनदेखा कर देने से एक ऐसा विश्लेषण बनता है जो विश्वस्नीय नहीं है।

6. निकटस्थ अवधि

आयु या रोग के कारण अधिकांश मौतें होती हैं यानी समय के साथ डाटा औसत के निकट (मीन-रीवर्टिंग) ही जाना चाहेगा। सुनने में बुरा लगेगा लेकिन यदि किसी अवधि में कम लोग मर रहे हैं तो उसकी अगली अवधि में अधिक मौतें होने की संभावना अधिक होती है।

मीन-रीवर्टिंग का उदाहरण

औसत स्थिर रहता है क्योंकि मृत्यु के कारण कमोबेश एक ही रहते हैं। यदि किसी पूर्व अवधि में औसत से कम मौतें हुईं तो मीन-रिवर्ज़न के कारण अधिक मौतें होंगी, न कि कोविड के कारण। इसलिए हमें लगातार अवधियों का भी डाटा देखना चाहिए। सही विश्लेषण में पूर्व और बाद की अवधियों का डाटा भी होने चाहिए।

7. आरोपण

लेखों में अतिरिक्त मौतों का उद्धरण देकर 5-गुना या 10-गुना मृत्यु की अंडर-रिपोर्टिंग की बात कही जाती है। लेकिन अतिरिक्त मौतों का पूरा दोष कोविड पर देने का कोई आधार नहीं है क्योंकि महामारी के कारण दूसरी बीमारियों के उपचार में भी समस्या हो रही हैं जिससे मौतों का आँकड़ा बढ़ सकता है।

8. चयन में पक्षपात

वास्तविक वैज्ञानिकों के डाटा में निष्कर्ष उल्टे या निष्कर्ष ही नहीं निकल पाते। यदि आप दर्जनों डाटासेट का विश्लेषण करते हैं, तब जाकर आपको दिखाने योग्य निष्कर्ष मिलेंगे। यदि कोई डाटा किसी एक क्षेत्र का प्रतिनिधित्व करता है तो उस क्षेत्र को चुन लेने से देश का प्रतिनिधित्व नहीं हो जाएगा।

9. एक्स्ट्रापोलेशन

विश्लेषण प्रायः किसी काल या स्थान पर आधारित होते हैं। यदि आप पूरे देश या लंबे समय के लिए उसे एक्स्ट्रापोलेट करते हैं तो काफी ध्यान देना चाहिए। सबसे खराब स्थिति को दर्शाते हुए हेडलाइन बना देना और भ्रम खड़ा करना उतना ही आधारहीन है जितना गलत उद्देश्यों से यह किया गया है।

यह लेख एक विशेष अभिदाता का है।