قالب‌های فایل

تاریخ بازبینی ۱۳۹۵/۰۶/۱۵

همانند هرگونه داده‌ای، روش‌های مختلفی برای ذخیره‌سازی دادهٔ جغرافیایی در یک کامپیوتر وجود دارد. می‌توان آن را در پایگاه‌داده ذخیره کرد، که یک سیستم تخصصی برای ذخیره و بازیابی داده است. خوب است بدانید سیستم‌های پایگاه‌دادهٔ اختصاصی برای ذخیره‌سازی دادهٔ جغرافیایی طراحی شده‌است. همچنین می‌توان آن را به‌صورت فایل‌های کامپیوتری سنتی ذخیره نمود، هرچند انواع مختلفی از قالب‌های فایل برای دادهٔ جغرافیایی وجود دارد.

در این بخش، چندین روش ذخیره‌سازی دادهٔ جغرافیایی را می‌آموزیم، توضیح می‌دهیم چگونه کار می‌کنند و معمولاً چگونه استفاده می‌شوند.

فایل‌های ‎.OSM

قالب فایل osm‎. مخصوص OpenStreetMap است. هیچ جای دیگری به آن بر نخواهید خورد. اگر تا به حال با استفاده از JOSM داده دانلود کرده و آن را در یک فایل ذخیره کرده باشید، ممکن است متوجه شده باشید که فایل با پسوند ‎.osm ذخیره می‌شود. اگر کاربر GIS هستید، شاید متوجه شده باشید که بازکردن این فایل‌ها با استفاده از نرم‌افزاری مانند QGIS آسان نیست.

پس چرا دادهٔ OSM در قالبی ذخیره می‌شود که هیچ کس دیگری نمی‌تواند از آن استفاده کند؟ پاسخ این است که بسیاری از ‌قالب‌های دادهٔ جغرافیایی برای پیش از دوران مدرن اینترنت هستند و برای دسترسی سریع و پرس‌وجوگیری همانند پرس‌وجو از یک پایگاه‌داده طراحی شده‌اند. از سوی دیگر، دادهٔ OSM، طوری طراحی شده‌است که ارسال و دریافت آن از طریق اینترنت به‌راحتی و در قالبی استاندارد انجام شود. ازاین‌رو، فایل‌های ‎.osm به زبان XML کدگذاری شده‌اند. این فایل‌ها دادهٔ جغرافیایی را در قالبی ساختاریافته و مرتب در خود نگه می‌دارند. یک فایل ‎.osm ساده را اگر در ویرایشگر متن باز کنید این‌گونه خواهد بود:

Sample OSM XML file

به‌دست‌آوردن داده در قالب ‎.osm آسان است - هر بار که در JOSM داده دانلود می‌کنید، این کار را انجام می‌دهید. اما استفاده از این فایل‌ها برای تجزیه‌وتحلیل و طراحی نقشه آسان نیست. ازاین‌رو بهتر است که داده را به قالب دیگری تبدیل کنید یا آن را از جایی بگیرید که داده را برایتان تبدیل می‌کند.

دادهٔ خام OSM معمولاً در فایل‌های ‎.osm ذخیره می‌شود، اما ممکن است فایل‌هایی ببینید که پسوند ‎.bz2 و ‎.pbf دارند. این‌ها اساساً همان فایل‌های ‎.osm هستند که برای صرفه‌جویی در فضای ذخیره‌سازی، فشرده شده‌اند، که البته هنگام کار با فایل‌های دادهٔ بسیار حجیم، فوق‌العاده سودمند هستند.

فایل‌های شیپ (Shapefiles)

shapefile قالبی است که به‌طور گسترده برای ذخیره‌سازی دادهٔ جغرافیایی بُرداری به کار می‌رود. این قالب را شرکت ESRI ساخته است. ESRI همان شرکت سازندهٔ ArcGIS (مجموعه‌ای از برنامه‌های محبوب GIS) است.

فایل شیپ در واقع مجموعه‌ای از چندین فایل مختلف است. به‌عنوان مثال، شیپ‌فایلی که حاوی دادهٔ ساختمان است ممکن است فایل‌هایی با پسوندهای زیر داشته باشد:

  • buildings.shp
  • buildings.shx
  • buildings.dbf

شیپ‌فایل‌ها اغلب فایل‌های اضافه‌تری نیز دارند که حاوی اطلاعات دیگر هستند.

هر شیپ‌فایل باید فقط یک نوع عارضه (نقاط، خطوط یا چندضلعی‌ها) را نگه دارد، و خصوصیات هر عارضه در یک جدول نگهداری می‌شود. بر خلاف سیستم OpenStreetMap که در آن هر شی می‌تواند تعداد نامحدودی برچسب داشته باشد، خصوصیات عارضه‌ها در فایل‌های شیپ باید مطابق ساختار جدولی تعریف‌شده برای شیپ‌فایل‌ها باشد. که ممکن است چیزی شبیه این باشد:

Shapefile attributes

دادهٔ OpenStreetMap را می‌توان به شیپ‌فایل تبدیل کرد. وبسایت‌های مختلفی فایل‌های شیپ تبدیل‌شده از دادهٔ OSM را ارائه می‌کنند. این‌ها در فصل بعدی بحث شده‌اند.

پایگاه‌داده‌ها

انواع گوناگونی از اطلاعات در سیستم‌های پایگاه‌داده‌ای ذخیره می‌شوند که روشی منطقی برای سازماندهی و دسترسی به داده فراهم می‌کنند. دادهٔ جغرافیایی نیز همان‌گونه است، گرچه پایگاه‌داده‌های مخصوص دادهٔ جغرافیایی به‌طور تخصصی جهت فائق‌آمدن بر کارکردهای پیچیده‌ای که پرس‌وجوی دادهٔ جغرافیایی مستلزم آن‌هاست، طراحی شده‌اند.

دادهٔ OpenStreetMap اغلب در یک پایگاه‌دادهٔ PostgreSQL با PostGIS extensions ذخیره می‌شود. این نوع پایگاه‌داده دسترسی سریع به داده را فراهم می‌کند و می‌توان به‌آسانی با Mapnik (نرم‌افزاری که کاشی‌های نقشه را برای نقشه‌های لغزان وبی تولید می‌کند) از آن استفاده کرد. چندین ابزار برای درون‌برد دادهٔ خام OSM به پایگاه‌دادهٔ PostgreSQL وجود دارد.

نوع دیگری از پایگاه‌داده SQLite است، که کارکردی مشابه با پایگاه‌دادهٔ PostgreSQL ارائه می‌دهد. اما همهٔ داده در یک فایل ذخیره می‌شود و نیازی به اجرای نرم‌افزار پایگاه‌داده ندارد. ایجاد این‌ها به دست خودتان کمی دشوارتر است، اما هنگام کار با مجموعه‌داده‌های کوچک کار با آن‌ها آسان‌تر است.

خلاصه

در فصول بعد خواهیم دید که چگونه می‌توانید داده را در قالب‌های مختلف از اینترنت دانلود کنید و چگونه با استفاده از ابزارهای متنوع دادهٔ خام را شخصاً دستکاری کنید.