آینده نگری در داده کاوی را شرح دهید؟
داده کاوی فرآیند استخراج اطلاعات مفید در داده ها است. داده کاوی استخراج اطلاعات پیشگویانه از پایگاه داده بزرگ ، یک روش جدید قدرتمند با انرژی عظیم . ابزارهای داده کاوی رفتارها و گرایش های آینده را پیش بینی می کنند و این امکان را به تجارت ها می دهد تا بر اساس دانش تصمیم گیری کنند. تحلیل های اتوماتیک و آینده نگر که توسط داده کاوی پیشنهاد می شود فراتر از تحلیل هایی قرار می گیرند که طبق رویدادهای گذشته توسط ابزارهای قبلی سیستم های تصمیم گیری انجام شده اند. داده و اطلاعات یا دانش نقش اساسی را در فعالیت های بشر ایفا می کنند. داده کاوی یک پروسه کشف دانش از طریق تحلیل حجم عظیمی از داده از چشم اندازهای گوناگون و خلاصه سازی آن به اطلاعات مفید و سودمند می باشد. به دلیل اهمیت استخراج اطلاعات از منابع عظیم داده، داده کاوی به یک جز ضروری و مهم در بخش های مختلف زندگی بشری تبدیل شده است . پیشرفت هایی در زمینه های آمار، فراگیری ماشین، هوش مصنوعی،الگوشناسی و محاسبات باعث ترقی برنامه های داده کاوی امروزی شده و این برنامه ها باعث توانمندی و بهبود زمینه های مختلف زندگی بشری شامل تجارت، تحصیل و پزشکی شده اند.
مراحل انجام ETL را نام برده و توضیح دهید؟
فرآیند ETL که در واقع عملیات اصلی در درست کردن انبارداده است، خود از سه قسمت تشکیل شده است. استخراج (Extract)، تبدیل (تغییرات) (Transformation) و بارگزاری (Load).
در مرحله اولی، دادهها از منابع مختلف، توسط فرآیند استخراج (Extract)، استخراج شده و در مخزنی به نام محل استقرار (Staging Area) قرار میگیرد. در واقع در مرحله استخراج داده، که مرحله اول ETL است، دادهها از منابع دادهای استخراج شده و در Staging Area ذخیره میشوند. مرحله استخراج باعث میشود دادههایی که در منابع مختلف بوده و دارای سیستم عاملهای متفاوت و ساختار بازیابی گوناگون هستند جمعآوری شوند تا بتوان بر روی آنها عملیات پردازشی را انجام داد.
مرحله دوم تبدیل (Transformation) است. این مرحله که قلب اصلی فرآیند ETL به شمار میرود در Staging Area انجام میشود تا انجام عملیات (بعضا سنگین) مزاحم انبارداده و یا منابع دادهای منبع نباشد. حتما توجه دارید که دادههایی که در منابع دادهای مختلف هستند به صورت خام ذخیره شدهاند و قبل از اینکه در انبارداده ذخیره شوند نیاز به تغییراتی دارند. با این تغییرات و تبدیلها، دادهها آماده انبار کردن میشوند. مثلا اگر بخواهید نام و نام خانوادگی یک شخص را همراه با پسوند این شخص در یک فیلد انبار کنید و هر کدام از اینها در مخزن جدایی باشد، در این مرحله (مرحله تبدیل) بایستی این تغییرات را انجام دهید.
مرحله سوم بارگزار (Load) است که دادههای تغییریافته و آماده شده توسط مرحله قبل (مرحله تبدیل-Transformation) در انبارداده بارگزاری میگردد.
درباره این سایت