يادگيري ماشين با نظارت | Supervised Machine Learning چيست ؟
يادگيري ماشين با نظارت | Supervised Machine Learning نوعي يادگيري است كه در آن ماشين يا مدل با استفاده از داده هاي آموزشي (داراي برچسب صحيح) آموزش داده مي شود تا بتواند براي داده هاي تستي يا جديد، فرايند تشخيص برچسب (تشخيص خروجي يا پيش بيني خروجي) را انجام دهند. منظور از داده هاي داراي برچسب اين است كه برخي از داده هاي ورودي قبلاً با خروجي صحيح برچسب گذاري شده اند.
داده هاي آموزشي (داراي برچسب صحيح) در يادگيري ماشين با نظارت | Supervised Machine Learning براي آموزش يك مدل يا ماشين استفاده مي شود تا بعدها آن مدل بتواند با توجه به آموزش فرا گرفته شده در امتحانات نمره خوبي كسب كند. منظور از امتحانات، همان پيش بيني برچسب صحيح براي داده هاي ورودي جديد مي باشد. شما مي تواند اين پاراگراف را از طريق مثال يك دانش آموز و معلم بهتر درك كنيد. به عنوان مثال در مدرسه، معلم سوالات و پاسخ هاي صحيح را به دانش آموز آموزش مي دهد و در پايان ترم از دانش اموز امتحان مي گيرد، اگر دانش آموز بتواند براي سوالات، پاسخ هاي درستي بنويسيد نمره خوبي كسب مي كند در غير اين صورت ممكن از رفوزه شود.
در دوره آموزشي جامع علم داده مدرس كاظم تقنديكي تمام A-Z علم داده (يادگيري ماشين، داده كاوي) را به شكل كاملاً عملي و با زباني ساده به شما آموزش مي دهد
هدف يك الگوريتم يادگيري با نظارت، يافتن يك تابع نگاشت براي ترسيم متغير ورودي (x) با متغير خروجي (y) است يا نگاشت يك سوال به يك پاسخ صحيح مي باشد.
در دنياي واقعي، از يادگيري با نظارت مي توان براي ارزيابي ريسك، طبقه بندي تصوير، تشخيص تقلب، فيلتر هرزنامه و غيره نيز استفاده كرد.
يادگيري با نظارت | Supervised Machine Learning چگونه كار مي كند
در يادگيري نظارت شده | Supervised Machine Learning، مدلها با استفاده از مجموعه دادههاي برچسبگذاري شده آموزش داده ميشوند، پس از تكميل فرآيند آموزش، مدل بر اساس داده هاي آزمون داراي برچسب واقعي (زيرمجموعه اي از مجموعه داده) آزمايش مي شود تا براي آن ها خروجي صحيح را پيش بيني كند. اگر خروجي بدست امده شده مانند خروجي واقعي داده هاي آزمون باشد مي توانيم بگيم مدل ما از دقت خوبي برخوردار است و مي تواند در كسب و كار به منظور افزايش سود دهي از آن استفاده كرد در غير اينصورت بايد به فكر چاره در فرآيند كار بود.
فرض كنيد مجموعه داده اي از انواع مختلف اشكال داريم كه شامل مربع، مستطيل، مثلث و چند ضلعي است. اكنون اولين قدم اين است كه بايد مدل را براي هر شكل آموزش دهيم.
- اگر شكل داده شده چهار ضلع داشته باشد و همه اضلاع آن برابر باشند، آن را به عنوان مربع علامت گذاري مي كنيم .
- اگر شكل داده شده داراي سه ضلع باشد، به عنوان يك مثلث علامت گذاري مي شود .
- اگر شكل داده شده شش ضلع مساوي داشته باشد، به عنوان شش ضلعي علامت گذاري مي شود .
حالا بعد از گام آموزش، مدل خود را با استفاده از مجموعه تست ( آزمايش )، تست (ارزيابي) مي كنيم تا ببينيم براي شكل هاي تستي به درستي فرايند تشخيص نوع شكل را با توجه به تعداد اضلاع آن، انجام مي دهد يا خير.
در دوره آموزشي جامع علم داده مدرس كاظم تقنديكي تمام A-Z علم داده (يادگيري ماشين، داده كاوي) را به شكل كاملاً عملي و با زباني ساده به شما آموزش مي دهد
مراحل مربوط به يادگيري با نظارت:
- ابتدا يك مجموعه داده يا ديتاست انتخاب مي كنيم.
- سپس مجموعه داده را به مجموعه داده آموزشي (75 درصد داده ها) و مجموعه داده آزمايشي (25 درصد داده ها) تقسيم كنيد.
- ويژگي هاي ورودي مجموعه داده آموزشي را تعيين كنيد، كه بايد دانش كافي داشته باشد تا مدل بتواند خروجي را از طريق آن ها به طور دقيق پيش بيني كند.
- يك الگوريتم يادگيري ماشين از نوع با نظارت (مانند ماشين بردار پشتيبان، درخت تصميم) را با توجه به ساختار داده هاي آموزشي و آزمايشي انتخاب مي كنيم
- الگوريتم را روي مجموعه داده آموزشي اجرا كنيد تا مدل آموزش ديده ساخته شود.
- با ارائه مجموعه تست، دقت مدل ساخته شده از مرجله قبل را ارزيابي مي كنيم.
در دوره آموزشي جامع علم داده مدرس كاظم تقنديكي تمام A-Z علم داده (يادگيري ماشين، داده كاوي) را به شكل كاملاً عملي و با زباني ساده به شما آموزش مي دهد
انواع الگوريتم هاي يادگيري ماشيني تحت نظارت
رگرسيون
اگر رابطه اي (مثل رابطه افزايشي يا كاهشي) بين متغير ورودي (ويژگي ها) و متغير خروجي (برچسب) وجود داشته باشد از الگوريتم هاي رگرسيون استفاده مي شود. از اين نوع الگوريتم ها براي پيشبيني متغيرهاي پيوسته، مانند پيشبيني آبوهوا، روند بازار، و غيره استفاده ميشود. در ادامه انواع الگوريتم هاي رگرسيون ذكر شده است.
- رگرسيون خطي
- درختان رگرسيون
- رگرسيون غير خطي
- رگرسيون خطي بيزي
- رگرسيون چند جمله اي
دسته بندي
از الگوريتمهاي دسته بندي زماني استفاده ميشوند كه متغير خروجي از نوع طبقه بندي ( Categorical ) باشد يا بتوان آن را به اين نوع تبديل كرد، به اين معني كه متغير خروجي از نوع دو كلاسه مانند بله-نه، مذكر-مونث، درست-كاذب و غيره وجود باشد. در ادامه انواع الگوريتم هاي دسته بندي ليست شده اند.
- جنگل تصادفي | Random Forest
- درخت تصميم
- رگرسيون لجستيك
- ماشين بردار پشتيبان | SVM
مزاياي يادگيري با نظارت
- با استفاده از يادگيري با نظارت، مدل مي تواند خروجي را بر اساس تجربيات قبلي (آموزش) پيش بيني كند.
- در يادگيري نظارت شده، ميتوانيم ايده دقيقي درباره كلاسهاي اشياء داشته باشيم.
- مدل به دست آمده در يادگيري نظارت شده به ما كمك مي كند تا مشكلات مختلف دنياي واقعي مانند كشف تقلب، فيلتر هرزنامه و غيره را حل كنيم.
معايب يادگيري با نظارت
- مدل هاي يادگيري با نظارت براي انجام وظايف پيچيده مناسب نيستند.
- اگر داده هاي آزمون با مجموعه داده آموزشي متفاوت باشد، يادگيري تحت نظارت نمي تواند خروجي صحيح را پيش بيني كند.
- گام آموزش در الگوريتم هاي يادگيري با نظارت به زمان محاسباتي زيادي نياز دارد.
- در يادگيري نظارت شده، ما به دانش كافي در مورد طبقات داده ها نياز داريم..
برچسب: آموزش SQL،آموزش SQL Server،دوره SQL،دوره آموزشي SQL Server،آموزش اس كيو ال سرور،آموزش PLSQL،آموزش بانك اطلاعاتي،آموزش پايگاه داده SQL،،