مفهوم
دادههای باز (Open Data) مبتنی بر این ایده است که برخی از دادهها باید بهصورت
رایگان در اختیار همه قرار گیرد تا بتوانند آن را آنگونه که میخواهند استفاده،
باز استفاده و منتشر کنند، بدون آنکه با محدودیت حق نشر (Copyright)، حق اختراع (Patent) و یا سایر محدودیتها مواجه شوند.
در تعریف بالا سه جنبه مهم پررنگ شده است:
دسترسی: داده باید با هزینه معقول و بهسادگی در دسترسی باشد؛ در
بهترین حالت از طریق بارگیری کردن از اینترنت بتوان آن را به دست آورد. همچنین
داده باید بهگونهای ارائه شود که بتوان در آن تغییراتی ایجاد کرد.
باز استفاده و بازنشر: داده باید تحت شرایطی منتشر شود که به افراد اجازه دهد آن
را به شکل دلخواه استفاده و یا بازنشر کنند و یا بتوانند با سایر پایگاههای داده
ترکیب کنند.
مشارکت همگانی: دادهها باید برای همه گروهها و هر تلاشی در هر حوزهای آزاد
باشند. برای مثال، نباید حق دسترسی تنها محدود به فعالیتهای غیرتجاری (Non-commercial) باشد؛
به این معنی که استفاده تجاری از دادهها محدود شود. و یا نباید استفاده از دادهها
تنها برای اهداف خاصی مانند اهداف آموزشی آزاد باشد.
توجه شود در این مقاله هر جا صحبت از داده میکنم منظور “داده غیرشخصی” است؛ به این معنی که حاوی اطلاعاتی است که قابل تخصیص به فرد مشخصی نیست.
طیف دادهها در
این نمودار شامل دادههای بسته (Closed Data)، دادههای اشتراکی (Shared Data) و دادههای باز (Open Data) است. برای نمونه
داده فروش یک شرکت که در آن اسامی خریداران به همراه میزان خرید و نوع محصول
خریداریشده آمده است، داده بسته محسوب و محرمانه تلقی میشود. دادههای تجمعی که
درنتیجه یک تحقیق پزشکی روی گروهی از بیماران بهدستآمده، نمونهای از دادههای
اشتراکی است. با فرض اینکه تحقیق با رعایت تمام اصول اخلاقی و محرمانگی انجام شده
باشد، نتایج کلی تحقیق قابلانتشار است؛ برای مثال اینکه یک دارو روی گروهی از
بیماران با یک ویژگی خاص اثر گذاشته یا نه. جدول زمانی ورود و خروج قطارها به
ایستگاههای مختلف متروی تهران، نمونه یک داده باز میتواند باشد که باید بهراحتی
در دسترس همگان قرار گیرد.
دلایل حرکت بهسوی دادههای باز
فلسفه اصلی دادههای
باز مشابه سایر جنبشهای مبتنی بر حق دسترسی آزاد مانند نرمافزارهای متنباز (Open Source)، آموزش باز (Open Education) و … است. داده مانند هر کالای دیگری دارای مزایای بالقوهای است. مانند
نفت، برای آنکه بتوان از مزایای بالقوه داده بهره برد، باید آن را پالایش کرد؛ بهخودیخود
نمیتوان آن را بکار گرفت. زمانی که دادهها در دسترس عموم قرار میگیرند افراد،
سازمانها و دانشمندان را قادر میسازد که به گونه جدید آنها را بازآفرینی کنند و
در جهت نوآوری و خلق ارزش جدیدی آن را بکار گیرند.
در ادبیات این
حوزه مزایای زیر را برای ایجاد پایگاههای داده باز برشمردند:
شفافیت: در حوزه حاکمیتی، انتشار دادهها نقش
مهمی در کاهش فساد دارد. دادههای باز امکان بیشتری برای پایش فعالیتهای حاکمیتی
میدهد؛ برای مثال اجازه میدهد تا نحوه هزینه کردن بودجه روشن و اثرات آن مشخص
شود. همینطور شهروندان را تشویق میکند تا مشارکت بیشتری در نظارت بر حاکمیت
داشته باشند. در حوزه شرکتی، دادههای باز در درجه اول به خود آن شرکت کمک میکند
تا همه بخشهای سازمان از وجود دادهها باخبر شوند و فعالیتهای موازی و پرهزینه
برای جمعآوری دادههایی که قبلاً توسط سازمان انجام شده، صورت نگیرد. این شفافیت
بقیه شرکتها را هم تشویق (یا مجبور) خواهد کرد به سمت آزاد کردن دادههای خود پیش
بروند و فرصتهای جدیدی از کنار هم قرار دادن پایگاههای دادههای کسبوکارهای
مختلف ایجاد میشود. همچنین انتشار آزاد دادهها، نگاه مثبت جامعه و مطبوعات را به
آن شرکت تقویت میکند.
نوآوری و خلق ارزش اقتصادی: مثالهای متنوعی وجود دارد که نشان میدهد انتشار دادهها و
بازاستفاده از آنها میتواند نوآوری و فرصتهای اقتصادی جدیدی خلق کند. بهرهگیری
از دادههای باز میتواند برای فهم رفتار مصرفکنندگان در بازار و خلق محصولات
جدید دادهمحور استفاده شود. برای نمونه استارتاپ GeoLytix در انگلستان که متخصص استفاده از دادههای مکانی است، با استفاده
از دادههای عمومی شهر لندن، خدماتی را ارائه میدهد که سایر کسبوکارها از آن
بهره میبرند.
شرکت مشاوره مک کنزی (McKinsey & Company) در گزارشی اعلام کرده است که دادههای باز میتواند به ابزاری تبدیل شود که فاصله بین صنایع مختلف را کاهش و اجازه دهد که بین الگوهای سرآمد (Best Practices) در صنایع مختلف مقایسه صورت گیرد که به افزایش بهرهوری منجر میشود. این فرآیند درنهایت به سازمانها کمک میکند تا تصمیمگیری شهودی را با تصمیمگیری دادهمحور جایگزین کنند. برآورد این گزارش حاکی است دادههای باز این پتانسیل را دارد که بین ۳ تا ۵ تریلیون دلار در صنایع مختلف در آمریکا ارزش اقتصادی ایجاد کند.
بهبود جامعه: دادههایی که توسط دولتها و یا شرکتها تولید میشود میتواند نقش مهمی در بهبود جامعه داشته
باشد؛ برای مثال در حوزه برنامهریزی شهری یا دادن بازخورد درباره طرح و سیاستهای
کلان جامعه بکار رود. به همین دلیل بود که در سال ۲۰۱۸، شرکتهای خودروسازی فورد (Ford Motor Company)، لیفت (Lyft) و اوبر (Uber) توافقی امضاء
کردند تا دادههای خود را در قالب پلتفرمی بانام SharedStreets به اشتراک بگذارند تا از آن برای مدیریت شهری استفاده شود.