toluesoft

نگرانی های مربوط به حریم خصوصی در رایانش ابری

مسایل مربوط به حریم خصوصی و محرمانگی در سیستم های مدیریت کنفرانس نمایان گر مشکلاتی کلی تر هستند.
رایانش ابری به معنی سپردن داده ها به سیستم های اطلاعاتی تحت کنترل شرکت ها ی خارجی است. سیستم نامه نگاری تحت وب و اسناد آنلاین (مانند Google Docs) نمونه هایی شناخته شده از این روش هستند. رایانش ابری باعث افزایش نگرانی ها در زمینه محرمانگی و حریم خصوصی شده است زیرا سرویس دهنده الزاماً به تمامی داده ها دسترسی دارد و می تواند تصادفاً یا به عمد آنها را افشا کند یا برای مقاصد غیرمجاز به کار گیرد.
سیستم های مدیریت کنفرانس مبتنی بر رایانش ابری نمایان گر نمونه ای از این مشکلات درون جامعه تحقیقات علمی به شمار می روند. این مثال از آن جهت جالب است که به دلیل خاص و کوچک بودن، بررسی ماهیت دقیق مشکل حریم خصوصی و یافتن راه حل هایی برای آن را ساده تر می کند. این ستون مشکل را شرح، برخی از تبعات نامطلوب آن را برجسته و سپس راهنمایی هایی برای مواجهه با آن ارائه می کند.

سیستم های مدیریت کنفرانس

بیشتر کنفرانس های علمی با استفاده از نرم افزارهایی مدیریت می شوند که به اعضای کمیته برنامه ریزی (PC) امکان می دهند از طریق وب به تورق مقالات، مرور کارشناسی و بحث بپردازند. در این روش، مدیر کنفرانس یک نرم افزار تحت سرور مناسب مانند HotCRP یاiChair را بارگذاری و میزبانی می کند. استفاده از این نرم افزار مزایای آشنایی دارد:
* توزیع مقالات میان اعضای کمیته برنامه ریزی خودکار است و ترجیحات و تعارض منافع آنها را نیز به حساب می آورد.
* سیستم، جمع آوری و توزیع مرورهای کارشناسی و مباحث را سازماندهی می کند، می تواند براساس امتیازات به مقالات رتبه دهد و ایمیل های یادآوری و همچنین نتیجه قبول یا رد مقالات را ارسال کند.
* علاوه بر این می تواند گزارش های دیگری مانند فهرست مرورکنندگان جزء، آمار پذیرش مقالات و برنامه کنفرانس را نیز تولید کند.
نرم افزارهای HotCRP و EDAS باید توسط مدیر کنفرانس بارگذاری و بر روی سرور وب نصب و میزبانی شوند. روش کار سیستم های دیگری مانند EasyChair و EDAS مبتنی بر مدل رایانش ابری است: مدیر کنفرانس به جای نصب و میزبانی در سرور، فقط به سادگی برای کنفرانس یک حساب «درون ابر» باز می کند. علاوه بر مواردی که پیش از این گفته شد، این مدل مزایای دیگری نیز دارد:
* کلیه کارهای مربوط به مدیریت سرور (مانند پشتیان گیری و امنیت) بر عهده فرد دیگری است که موجب صرفه جویی در هزینه ها می گردد.
* نویسندگان مقالات و اعضای کمیته از پیش حساب دارند و نیازی نیست برای هر کنفرانس برایشان حسابی باز شود.
* هیچ محدودیتی برای ذخیره داده ها وجود ندارد و لازم نیست مرورکنندگان یک نسخه از مرورهای خود را نگه دارند.
* و سیستم می تواند با پیشنهاد همکاران احتمالی براساس سابقه همکاری های گذشته به تکمیل فرم های دعوت از اعضا و ثبت مقالات کمک کند.
به این دلایل EasyChair و EDAS کمک بزرگی به جامعه علمی هستند. EasyChair به نوشته وب سایت خود در سال 2010 میزبان بیش از 3300 کنفرانس بوده است. به دلیل مزایایی که این سیستم برای کنفرانس های چند گانه و کنفرانس های موازی فراهم می کند، کنفرانس مشترک منطق (FLOC) که یک کنفرانس بزرگ موازی با بیش از 1000 مقاله است، استفاده از آن را الزامی نموده است.

نگرانی های مربوط به خصوصی بودن داده ها

افشای عمدی یا تصادفی: نگرانی های مربوط به خصوصی بودن داده ها با استفاده از سیستم های مدیریت کنفرانس مبتنی بر رایانش ابری مانند EasyChair و EDAS افزایش می یابد زیرا مدیران سیستم مسئول نگهداری از حجم عظیمی از داده ها در مورد رفتار گذشته ارسال و مرور مقاله هزاران محقق و کنفرانس های متعدد هستند. اگر این داده ها عمداً یا تصادفاً نتایج ناخوشایندی به بار خواهد آمد. از
* ناشناس بودن مرورکننده و محرمانگی بحث های اعضای کمیته از بین می رود.
* سابقه موفقیت افراد و گروه های محقق در پذیرش مقاله در طول چندین سال مشخص خواهد شد.
* سابقه مرور محققین (منصف/ غیر منصف، کامل/ناقص، به موقع/با تأخیر بودن مرورها) افشا می شود.
این اطلاعات می توانند توسط کمیته های استخدام و ترفیع، کمیته های تخصیص بودجه تحقیقاتی و اعطای جوایز و به طور عام تر توسط محققین برای انتخاب همکاران مورد سوء استفاده قرار گیرد. وجود این داده ها به تنهایی مدیران سیستم را در برابر دریافت رشوه، اعمال فشار و تلاش برای نفوذ به سیستم آسیب پذیر می کند. اگر هم این مدیران خود محقق باشند، در موقعیت تعارض منافع قرار خواهند گرفت.
مشکل کلی خصوصی بودن داده ها مشکلی شناخته شده است ولی رایانش ابری آن را چند برابر می کند. زمانی هم که سازمان دهندگان کنفرانس مجبور بودند نرم افزار را از ابتدا نصب کنند خطر از بین رفتن محرمانگی وجود داشت ولی در آن حالت داده ها فقط مربوط به یک کنفرانس بود. رایانش ابری امکان جمع آوری داده های هزاران کنفرانس در طول چندین دهه را فراهم می کند و در صورتی که این داده ها به دست افراد نادرست بیافتند، فرصتی بزرگ برای سوء استفاده آنها فراهم خواهد کرد.
داده کاوی سودمند: علاوه بر سوء استفاده از داده های مرور کنفرانس ها، استفاده های دیگری نیز وجود دارند که ممکن است سودمند تشخیص داده شوند. از داده ها می توان برای تشخیص و پیش گیری از سرقت علمی و سایر رفتارهای نامطلوب استفاده کرد. مثلاً می توان موارد زیر را تشخیص داد:
* محققینی که به صورت نظام مند و غیرمنصفانه مقاله های یکدیگر را تأیید می کنند، رقبایی که به صورت نظام مند مقالات یکدیگر را رد می کنند و یا محققینی که یک مقاله را رد می کنند و سپس مقاله ای مشابه را به کنفرانسی دیگر ارسال می کنند.
* الگوها و رفتارهای نامطلوب ارسال مقالات (مانند ارسال موازی یا پشت سر هم یک مقاله، باز پس گیری مکرر یک مقاله پذیرفته شده و ایجاد تغییرات متعدد میان مقاله ارسالی و نسخه نهایی).
از این داده ها می توان برای شناخت و بهبود شیوه مدیریت کنفرانس ها نیز بهره جست. مثلاً ACM می تواند با استفاده از این داده ها معیارهایی برای کیفیت کنفرانس ها تهیه کند، انواع نویسندگانی را که مقالات خود را ارسال می کنند ثبت کند، ببیند چه میزان «خون تازه» وارد رگ های جامعه علمی می شود و این روند در دوره های مختلف کنفرانس ها با هم چه تفاوتی دارند. این اطلاعات به شناخت کنفرانس هایی که اهمیت شان به طور روزافزون زیاد می شود و کنفرانس هایی که عمر مفید آنها به پایان رسیده است، کمک می کند. تصمیم گیری در مورد اینکه چه کسی و با چه اهدافی اجازه دارد این کاوش را انجام دهد، کار مشکلی است. خط مشی ها (سیاست ها) باید به طور شفاف و از طریق اجماع کلی اینکه فقط به آنهایی که در حال حاضر ده ها هستند، واگذار شود.

راه های پیش رو

تعیین خط مشی و قانون گذاری: گام واضح نخست، تعیین خطوط مشی روشنی است که محدودیت های روش های استفاده از این داده ها را مشخص کنند. یک سیاست ساده می تواند این باشد که داده های به دست آمده از طریق مدیریت یک کنفرانس باید تنها برای مدیریت همان کنفرانس مورد استفاده قرار گیرند. تبعیت از این قانون مستلزم پاک کردن داده ها پس از کنفرانس است، کاری که EasyChair انجام نمی دهد (در مورد EDAS اطلاعی ندارم). سایر خطوط مشی می توانند اجازه استفاده گسترده تر از داده ها را فراهم کنند. قابل انتظار است که کمیته های علمی برای رسیدن به اجماع در مورد کارهای مجاز و غیرمجاز بحث کنند. به عنوان مثال ممکن است برخی کمیته ها از تشخیص تقلب استقبال کنند ولی برخی دیگر آن را غیرمفید یا غیرضروری بیابند.
EasyChair از زمان شروع به کار در سال 2002 تا زمان نگارش این مقاله فاقد هرگونه سیاست حفظ حریم خصوصی یا تعیین اهداف یا کاربردهای احتمالی از داده هایی است که ذخیره می کند. در صفحه نخست هیچ پیوندی به سیاست های حفظ حریم خصوصی نیست و جستجوی این عبارت در سایت نیز نتیجه ای در پی ندارد. به من گفته اند که سیاست های حریم خصوصی به کاربران جدید هنگام عضویت در سایت ارائه می شود. برای آزمایش این مسأله حسابی جدید باز نکردم. به هر حال هیچ پیوندی به چنین متنی در هیچ کجای سایت وجود ندارد و از طریق جستجو نیز یافت نمی شود. EDAS یک سیاست حریم خصوصی دارد که به سادگی قابل دسترسی است و به نظر می رسد (نه چندان محکم) از قانون «استفاده فقط برای همین کنفرانس» تبعیت می کند.
یک راه دیگر می تواند یافتن محافظینی دیگر برای داده ها باشد، کسانی که خود محقق فعال در کنفرانس ها نباشند. ممکن است ACM یا IEEE به نظر مناسب برسند ولی آنها نیز در انتشار و انتخاب افراد نقش دارند. گزینه دیگر شرکت های حرفه ای مانند Google است. ممکن است یافتن یک محافظ خوب به ویژه با در نظر گرفتن عوامل هزینه ای مشکل باشد. بیشتر کشورها قوانینی برای محافظت از داده های شخصی دارند. قانون محافظت از داده انگلستان بر 8 اصل مبتنی است از جمله اینکه داده های شخصی فقط برای اهدافی خاص کسب می شوند و نباید در راه های ناسازگار با این اهداف مورد پردازش قرار گیرند و این اصل که داده ها را نباید بیش از زمان لازم برای هدف خاص آنها نگه داشت.
EasyChair در انگلستان میزبانی می شود ولی به دلیل فقدان یک بیانیه هدف قابل دسترس یا مدرکی مبنی بر ثبت تحت قانون محافظت از داده، نتوانستم در مورد تبعیت یا عدم تبعیت آن از قانون به نتیجه ای برسم، دستورالعمل حافظت از داده اتحادیه اروپا نیز شامل اصول مشابهی است: پردازش داده های شخصی فقط برای اهداف مشخص مجاز است و نمی توانند در مواردی ناسازگار با این اهداف مورد پردازش قرار گیرند.
پردازش داده های رمزنگاری شده در فضای ابر: تعیین سیاست ها گام نخست است و به تنهایی برای جلوگیری از سوء استفاده سرویس دهندگان کافی نیست. هدف تحقیقات فعلی رسیدن به فناوری ای است که تبعیت از سیاست های مورد پذیرش را تضمین کند. راهنمایی های زیر جامع و با تمامی جزئیات نیستند.
پیشرفت هایی در سیستم های رمزنگاری حاصل شده است که به کاربران اجازه می دهد داده های رمزنگاری شده خود را آپلود کنند و به سرویس دهندگان نیز امکان می دهد بدون رمز گشایی، بر روی آنها محاسبات و جستجو انجام دهند. با وجودی که چنین رمزنگاری ای اصولاً امکان پذیر است، اما تکنیک های فعلی از لحاظ توان محاسباتی و پهنای باند بسیار گران قیمت هستند و خیلی کاربردی به نظر نمی رسند.
اما تحقیقات ادامه دارد و همواره در حال پیشرفت است. نوآوری های امنیتی مبتنی بر سخت افزار مانند Trusted Platform Module و Trusted Execution Technologyشرکت اینتل طراحی شده اند تا به کاربران راه دور اطمینان دهند که از داده ها مطابق سیاست های مورد توافق استفاده می شود. از این فناوری ها می توان برای تضمین خصوصی بودن داده ها در رایانش ابری به طور کل و در سیستم های مدیریت کنفرانس به طور خاص استفاده کرد. با این حال پیش از دستیابی به یک سیستم قابل استفاده، هنوز به تحقیقات قابل ملاحظه ای نیاز است. برخی از ابزارهای رایانش ابری اساساً ابزارهای ذخیره داده هستند و نیازی به انجام پردازش های زیاد در سمت سرور ندارند. در چنین مواردی رمزنگاری داده پیش از ارسال به سرور می تواند واقع بینانه باشد. برای این کار باید کلیدهایی تهیه و به طور کاربردی و کارآمد میان کاربران به اشتراک گذاشت. محاسبات لازم نیز از طریق یک افزونه مرورگر انجام خواهد شد. امکان استفاده از این سازوکار برای سیستم های مدیریت کنفرانس ارزش تحقیق را دارد.

نتیجه گیری

بسیاری از افرادی که با آنها صحبت کرده ام معتقداند شهرت حرفه ای محافظین داده ها (و رئیس و اعضای کمیته برنامه ریزی) برای محافظت در برابر خطراتی که گفته شد کافی است. در واقع تبعیت متخصصین از رفتارهای اخلاقی برای حفظ محرمانگی الزامی است. در عمل مدیران سیستم می توانند تمامی ایمیل های سازمانی را بخوانند و کادر پزشکی به سابقه بیماری افراد مشهور دسترسی دارند. ما برای جلوگیری از اتفاقات ناخوشایند به شرافت همکاران مان اعتماد می کنیم. اما سخن من این است که باید میزان اتکای مان به رفتار درست دیگران را به حداقل برسانیم. ما تازه در ابتدای عصر دیجیتال هستیم و بسیاری از راه حل هایی که در حال حاضر می پذیریم در درازمدت مناسب نیستند.
مسایل مربوط به سیستم های مدیریت کنفرانس مبتنی بر رایانش ابری در بسیاری از حوزه های دیگر در بخش های مختلف صنعت و دانشگاه تکرار می شوند.
حل کلی مسأله انباشت داده ها بر روی سرورها بسیار مشکل است. جذابیت مورد خاصی که در این مقاله مورد بررسی قرار گرفت در این است که آنقدر کوچک هست که قابل حل باشد و کاملاً تحت کنترل خود جامعه علمی (که مستقیماً از هر راه حل مورد توافق نفع یا ضرر می برند) است.

تعداد بازدید : 3427
اشتراک گذاری:
هنوز دیدگاهی ثبت نشده‌است.شما هم می‌توانید در مورد این مطلب نظر دهید

یک نظر اضافه کنید

شماره موبایل شما منتشر نخواهد شد.زمینه های مورد نیاز هستند علامت گذاری شده *

امتیاز شما