پیش پردازش (تمیز کردن، آماده سازی و اصلاح داده ها) با نرم افزار OpenRefine

داده های انبوه که اغلب به هم ریخته و غیر تمیز هستند قبل از پردازش و تولید اطلاعاتی که بتوان به کمک آنها تصمیم سازی کرد، نیاز به عملیات تمیز کردن Clean up  داده ها، رفع خطاها، انجام عملیات پیچیده و آماده سازی داده دارند. نرم افزار OpenRefine یکی از نرم افزارهای قوی و کاربردی برای اصلاح و تبدیل داده ها میباشد.

آموزش ویدیویی این نرم افزار (حدود ۵ ساعت آموزش) را با سرفصل زیر میتوانید از سایت فرانش در لینک پایین تهیه نمایید:

  • در بخش اول این دوره مباحث مقدماتی شروع کار با نرم افزار شامل: معرفی نرم افزار و ضرورت تمیز کردن داده ها، توضیح مقدماتی، نصب برنامه و اجرا، آشنایی با محیط برنامه، import داده ها و کار با project history و export  گرفتن مطرح شده است.
  • در بخش دوم عملیات پایه ای داده ها روی سلول ها و ستون ها مانند: مرتب سازی داده ها، faceting و یافتن و حذف داده های تکراری، اعمال فیلتر و تبدیلات بحث شده است.
  • در بخش سوم میتوانید عملیات پیشرفته کار با داده ها از قبیل: سلول های چند مقداری، دسته بندی داده ها، تبدیل و تغییر و شکستن داده ها، جابجایی سطر و ستون ها و Reconcile (مرتبط کردن) داده ها را فرا بگیرید.
  • همچنین در انتها مباحث تکمیلی همچون: عبارات باقاعده (Regular Expressions) و کار با زبان GREL (زبان دستکاری داده ها) General Refine Expression Language اشاره شده است.

تهیه دوره آموزشی تمیز کردن داده ها با نرم افزار OpenRefine در سایت فرانش