WEBVTT

00:00:00.000 --> 00:00:10.000
ज्ञान का प्रोफेसर हूं। यह वेंडरबिल्ट मेडिकल स्कूल के प्रोफेसर ब्रैड मालिन के साथ महामारी के दौरान डेटा साझा करने के लिए गोपनीयता जोखिम 
00:00:10.000 --> 00:00:20.000
मूल्यांकन पर हमारा रैपिड काम है। इसलिए आप में से कई लोग समाचारों का पालन करते हैं, जैसे-जैसे COVID-19 आगे बढ़ता है, इस संबंध में नए प्र
00:00:20.000 --> 00:00:30.000
श्न सामने आ रहे हैं कि क्या यह दौड़ से संबंधित है, क्या उदाहरण के लिए धूम्रपान COVID-19, बुरे परिणामों आदि के साथ आपके जोखिम को बढ़ाता 
00:00:30.000 --> 00:00:40.000
है। इसलिए, इस तरह के सवालों के जवाब देने के लिए चाहे वह नस्ल और COVID-19 मृत्यु दर या अन्य कारकों जैसे धूम्रपान उच्च, रक्तचाप का संबंध 
00:00:40.000 --> 00:00:50.000
हो। स्पष्ट रूप से, हमें अधिक डेटा एकत्र करने की आवश्यकता है और निश्चित रूप से इस डेटा का विश्लेषण करने की आवश्यकता है।लेकिन दुर्भाग्य स
00:00:50.000 --> 00:01:00.000
े, या सौभाग्य से कुछ अर्थों में, गोपनीयता और गोपनीयता की आवश्यकताएं इस प्रयास को धीमा कर सकती हैं यदि आप जुलाई में प्रकाशित इस विज्ञान 
00:01:00.000 --> 00:01:10.000
लेख को देखते हैं, तो आप देखेंगे कि कैलिफोर्निया साझा नहीं करना चाहता था- कैलिफोर्निया राज्य के अधिकारी कुछ शोधकर्ताओं के साथ COVID-19 ड
00:01:10.000 --> 00:01:20.000
टा विवरण साझा नहीं करना चाहते थे, कुछ निश्चित शोधों में बाधा डालते हैं।इसलिए, एक अर्थ में वे सही हैं क्योंकि यह ज्ञात है कि साझा डेटा क
00:01:20.000 --> 00:01:30.000
ो आसानी से फिर से पहचाना जा सकता है। यह पिछले कई वर्षों पहले दिखाया गया है कि यदि आप अलग-अलग डेटा सेटों को जोड़ते हैं, उदाहरण के लिए, य
00:01:30.000 --> 00:01:40.000
दि आपके पास एक COVID-19 डेटा है जो ज़िप कोड, आयु और लिंग की रिपोर्ट करता है, तो इसे जल पंजीकरण सूचियों से जोड़ने और उन लोगों की पहचान क
00:01:40.000 --> 00:01:50.000
रने का अधिक जोखिम है जो COVID-19 रोगी डेटा में हैं। और निश्चित रूप से, यह थोड़ी देर के लिए जाना जाता है, इसलिए यह एक नई समस्या नहीं है 
00:01:50.000 --> 00:02:00.000
और इन जोखिमों को समझना पिछले बीस वर्षों में सक्रिय शोध रहा है। लेकिन फिर भी, COVID-19 ने कई चीजें बदल दीं।एक बात यह है कि अब हमारे पास,
00:02:00.000 --> 00:02:10.000
 विशेष रूप से सोशल मीडिया के साथ, हमारे पास अलग-अलग पुन: पहचान स्रोत हैं। यह द न्यूयॉर्क टाइम्स का एक उदाहरण है  जहां उन्होंने अपने जीव
00:02:10.000 --> 00:02:20.000
न की कहानियों में COVID-19 के कारण मरने वाले कई रोगियों को प्रोफाइल किया।इसलिए, यदि आप इस हमले के परिदृश्य पर वापस जाते हैं, तो अब आपके
00:02:20.000 --> 00:02:30.000
पास अतिरिक्त स्रोत हो सकता है जहां आप जानते हैं कि कुछ लोगों का निधन हो गया है और उनकी जानकारी और आप इसका उपयोग लक्ष्यों को हटाने और पह
00:02:30.000 --> 00:02:40.000
चान हमलों को फिर से चलाने के लिए कर सकते हैं।इसलिए यह रैपिड वास्तव में महामारी डेटा साझाकरण, विशेष रूप से पुन: पहचान जोखिमों के कारण अद
00:02:40.000 --> 00:02:50.000
्वितीय चुनौतियों को समझने की कोशिश कर रहा है। इसलिए, एक बात जो हम महसूस करते हैं वह यह है कि पिछले काम के विपरीत, धूम्रपान या दौड़ जैसे
00:02:50.000 --> 00:03:00.000
 साझा किए जाने वाले गुणों को समय के साथ बदल दिया जा सकता है। इसलिए, हमें वास्तव में इसे समझने की आवश्यकता है। इसके अलावा, केस नंबर बदल 
00:03:00.000 --> 00:03:10.000
रहे हैं, जिसका अर्थ है कि कुछ गोपनीयता जोखिम समय के साथ बदल सकते हैं, इसलिए हमें समय के साथ गोपनीयता जोखिमों को वास्तव में अपडेट करने क
00:03:10.000 --> 00:03:20.000
ी आवश्यकता है क्योंकि नए डेटा स्रोत दूसरों के साथ साझा किए जा रहे हैं। इसलिए महामारी डेटा साझाकरण का यह तेजी से बदलता और अनिश्चित व्यवह
00:03:20.000 --> 00:03:30.000
ार जोखिम मूल्यांकन ढांचे को प्रभावित करता है, और इसी कारण से हम अब मौजूदा मॉडलों को विकसित और अद्यतन कर रहे हैं।इसलिए, हमारा लक्ष्य वास
00:03:30.000 --> 00:03:40.000
तव में यह देखना है कि डेटा गोपनीयता लक्ष्यों को देखते हुए हम सबसे अच्छी उपयोगिता क्या प्राप्त कर सकते हैं, जो इस मामले में यह सुनिश्चित
00:03:40.000 --> 00:03:50.000
 करने के लिए कि पुन: पहचान जोखिम कम है, दूसरे शब्दों में लोगों को फिर से पहचानना बहुत कठिन है। और यह भी, डेटा उपयोगिता लक्ष्यों को देखत
00:03:50.000 --> 00:04:00.000
े हुए हम सबसे अच्छी संभव गोपनीयता क्या प्रदान कर सकते हैं? और फिर, हमारा लक्ष्य यथासंभव सटीक जानकारी देना है। दूसरा विकल्प खेल में आता 
00:04:00.000 --> 00:04:10.000
है क्योंकि यह तर्क है कि, आप जानते हैं, हमें वास्तव में बीमारी का मुकाबला करने पर ध्यान केंद्रित करना चाहिए ताकि डेटा गोपनीयता माध्यमिक
00:04:10.000 --> 00:04:20.000
 हो सके। फिर भी, हमारे पिछले शोध से पता चला है कि डेटा साझा करने के संबंध में आपके लक्ष्यों को देखते हुए, विभिन्न विकल्पों के अलग-अलग ग
00:04:20.000 --> 00:04:30.000
ोपनीयता परिणाम हो सकते हैं। इसलिए, यह समझना महत्वपूर्ण होगा। बेशक, प्रमुख दिशा होगी- डेटा उपयोगिता क्या है और इसे कैसे परिभाषित किया जा
00:04:30.000 --> 00:04:40.000
ए और यह हमारा चल रहा शोध है।निष्कर्ष निकालने के लिए, हमने पहचान जोखिम का विश्लेषण करने के लिए इस पर अपना पिछला काम बनाया और हम महामारी 
00:04:40.000 --> 00:04:50.000
के कारण समय-भिन्न और बदलती जानकारी की इस अनूठी चुनौती के आधार पर तकनीकों को अद्यतन और विकसित करते हैं। और जल्द ही, उम्मीद है, एक या एक 
00:04:50.000 --> 00:05:00.000
हीने की तरह, हमारे पास स्वास्थ्य अधिकारियों का मार्गदर्शन करने के लिए सामान्य डेटा साझाकरण नीतियां देने पर एक पेपर होगा जैसे कि कम जोखि
00:05:00.000 --> 00:05:10.000
म के साथ कौन सा डेटा साझा किया जा सकता है, उच्च जोखिम विकल्प क्या हैं, और इसका प्रभाव। तो कृपया हमें फॉलो करें यदि आपको डेटा साझाकरण और
00:05:10.000 --> 00:05:20.000
 महामारी डेटा की गोपनीयता के बारे में कोई चिंता है। तो, मैं यहाँ बंद कर दूँगा मुझे लगता है कि समय के साथ थोड़ा सा। धन्यवाद।

