داده های انبوه که اغلب به هم ریخته و غیر تمیز هستند قبل از پردازش و تولید اطلاعاتی که بتوان به کمک آنها تصمیم سازی کرد، نیاز به عملیات تمیز کردن Clean up داده ها، رفع خطاها، انجام عملیات پیچیده و آماده سازی داده دارند. نرم افزار OpenRefine یکی از نرم افزارهای قوی و کاربردی برای اصلاح و تبدیل داده ها میباشد.
آموزش ویدیویی این نرم افزار (حدود ۵ ساعت آموزش) را با سرفصل زیر میتوانید از سایت فرانش در لینک پایین تهیه نمایید:
- در بخش اول این دوره مباحث مقدماتی شروع کار با نرم افزار شامل: معرفی نرم افزار و ضرورت تمیز کردن داده ها، توضیح مقدماتی، نصب برنامه و اجرا، آشنایی با محیط برنامه، import داده ها و کار با project history و export گرفتن مطرح شده است.
- در بخش دوم عملیات پایه ای داده ها روی سلول ها و ستون ها مانند: مرتب سازی داده ها، faceting و یافتن و حذف داده های تکراری، اعمال فیلتر و تبدیلات بحث شده است.
- در بخش سوم میتوانید عملیات پیشرفته کار با داده ها از قبیل: سلول های چند مقداری، دسته بندی داده ها، تبدیل و تغییر و شکستن داده ها، جابجایی سطر و ستون ها و Reconcile (مرتبط کردن) داده ها را فرا بگیرید.
- همچنین در انتها مباحث تکمیلی همچون: عبارات باقاعده (Regular Expressions) و کار با زبان GREL (زبان دستکاری داده ها) General Refine Expression Language اشاره شده است.
تهیه دوره آموزشی تمیز کردن داده ها با نرم افزار OpenRefine در سایت فرانش