دوره آموزشی بانک اطلاعاتی NoSQL مونگو (MongoDB)

اگر بخواهیم برای یک اپلیکیشن شبکه اجتماعی یا یک وبسایت که در آن کاربران میتوانند به طور نامتناهی مطلب ارسال کنند، کامنت بنویسند، لایک کنند، کاربران دیگر را دنبال کنند و … پایگاه داده ای طراحی کنیم، آیا میتوان این داده ها را در یک ساختار جدولی ذخیره کرد؟

وقتی از وب سایت ها و اپلیکیشن هایی با میلیون ها کاربر آنلاین که هر لحظه در حال تولید و ارسال محتوا هستند صحبت میکنیم، بحث کارایی (Performance) بانک اطلاعاتی ای که میتواند این حجم انبوه داده ها را ذخیره، بازیابی و مدیریت کند بسیار اهمیت می یابد. دیتابیسی که بتواند داده های غیرساختاریافته  (UnStructured Data) یا نیمه ساختاریافته را ذخیره کرده و در دسترس بودن داده ها (Availablity) و امکان گسترش (Scalability) و تغییر ساختار در آینده را تضمین کند.

در این دوره آموزشی ابتدا بحث دیتابیس های NOSQL به تفصیل بیان شده و دلایل ضرورت و اهمیت آن شرح داده شده است. پس از آن نظریه CAP Theorem بیان شده که میتواند شروعی برای بحث انواع دیتابیس های نوین NoSQL باشد. دیتابیس های مبتنی بر سند (Document Oriented)، کلید-مقدار (Key-Value)، مبتنی بر ستون (Column Based) و مبتنی بر گراف (Graph Based) چهار نمونه از انواع دیتابیس های غیر رابطه ای هستند.

بانک اطلاعاتی MongoDB نوعی دیتابیس NoSQL و از نوع مبتنی بر سند است که بر اساس آمارها محبوبترین نوع از نظر کاربرد و نیاز میباشد. در این آموزش با شروع از توضیحات ابتدایی به نصب دیتابیس MongoDB پرداخته و عملیات گوناگون روی database، Collection، ِDocument ها بیان شده است. پس از آن دستورات درج و ویرایش و حذف و بازیابی اسناد از این پایگاه داده به همراه مثال بصورت عملی نشان داده شده است.

همچنین دستورات پیشرفته MongoDB برای مدیریت Index ها، ایجاد رابطه Relationship  و اجرای عملیات بصورت Atomic توضیح داده شده است و نکاتی که میتواند به مدیر دیتابیس برای آنالیز عملکرد و کارایی دیتابیس کمک کند اشاره شده است.

این آموزش میتواند به مهندسین کامپیوتر، فناوری اطلاعات و متخصصین داده، برای ایجاد درکی عمیق تر از مفهوم دیتابیس های غیر رابطه ای و شناخت بانک اطلاعاتی سندمحور MongoDB کمک نماید.

آموزش کار با دیتابیس MongoDB بصورت عملی به همراه مثال از مراحل ساخت دیتابیس، کالکشن، داکیومنت و دستورات CRUD شامل درج و حذف و بروزرسانی و دریافت داده ها را میتوانید در دوره آموزشی MongoDB مشاهده نمایید.

پیش پردازش (تمیز کردن، آماده سازی و اصلاح داده ها) با نرم افزار OpenRefine

داده های انبوه که اغلب به هم ریخته و غیر تمیز هستند قبل از پردازش و تولید اطلاعاتی که بتوان به کمک آنها تصمیم سازی کرد، نیاز به عملیات تمیز کردن Clean up  داده ها، رفع خطاها، انجام عملیات پیچیده و آماده سازی داده دارند. نرم افزار OpenRefine یکی از نرم افزارهای قوی و کاربردی برای اصلاح و تبدیل داده ها میباشد.

آموزش ویدیویی این نرم افزار (حدود ۵ ساعت آموزش) را با سرفصل زیر میتوانید از سایت فرانش در لینک پایین تهیه نمایید:

  • در بخش اول این دوره مباحث مقدماتی شروع کار با نرم افزار شامل: معرفی نرم افزار و ضرورت تمیز کردن داده ها، توضیح مقدماتی، نصب برنامه و اجرا، آشنایی با محیط برنامه، import داده ها و کار با project history و export  گرفتن مطرح شده است.
  • در بخش دوم عملیات پایه ای داده ها روی سلول ها و ستون ها مانند: مرتب سازی داده ها، faceting و یافتن و حذف داده های تکراری، اعمال فیلتر و تبدیلات بحث شده است.
  • در بخش سوم میتوانید عملیات پیشرفته کار با داده ها از قبیل: سلول های چند مقداری، دسته بندی داده ها، تبدیل و تغییر و شکستن داده ها، جابجایی سطر و ستون ها و Reconcile (مرتبط کردن) داده ها را فرا بگیرید.
  • همچنین در انتها مباحث تکمیلی همچون: عبارات باقاعده (Regular Expressions) و کار با زبان GREL (زبان دستکاری داده ها) General Refine Expression Language اشاره شده است.

تهیه دوره آموزشی تمیز کردن داده ها با نرم افزار OpenRefine در سایت فرانش