آلفا مشاور

مفاهیم اساسی در ماشین لرنینگ – بخش دوم

ماشین لرنینگ در عمل

 

الگوریتم های یادگیری ماشین فقط قسمت بسیار کمی از استفاده از ماشین لرنینگ در عمل به عنوان تحلیلگر داده یا دانشمند داده است. در عمل، فرآیند اغلب به شرح زیر است:

 

۱- حلقه را شروع کنید

  1. حوزه کاری، دانش و اهداف قبلی را بشناسید. با کارشناسان حوزه صحبت کنید. غالبا اهداف بسیار نامشخص است. شما غالبا چیزهای بیشتری برای امتحان کردن دارید، در نتیجه می توانید پیاده سازی کنید.
  2. یکپارچه سازی، انتخاب، تمیز کردن و پیش پردازش داده ها. این مرحله اغلب وقت گیر ترین قسمت است. داشتن داده های با کیفیت بالا مهم است. هرچه اطلاعات شما بیشتر باشد، بیشتر نامعین می شوند زیرا داده ها کثیف هستند. همان اصطلاح ورود زباله، خروج زباله.
  3. مدل های یادگیری. قسمت سرگرم کننده. این قسمت بسیار بالغ (کامل) است. ابزار ها کلی هستند.
  4. تفسیر نتایج. بعضی اوقات مهم نیست که مدل چگونه کار می کند، اگر که نتیجه دهد. دامنه (حوزه) های دیگر مستلزم قابل درک بودن مدل هستند. شما توسط متخصصان انسانی به چالش کشیده خواهید شد.
  5. تثبیت و به کارگیری دانش کشف شده. اکثر پروژه هایی که در آزمایشگاه موفق هستند در عمل استفاده نمی شوند. به کارگیری چیزی بسیار سخت است.

۲- پایان حلقه.

 

این یک فرایند تک مرحله ای نیست، بلکه یک چرخه است. شما باید حلقه را تا رسیدن به نتیجه ای که می توانید در عمل استفاده کنید، اجرا کنید. همچنین، داده ها می توانند تغییر کنند و نیاز به یک حلقه جدید دارند.

 

مفاهیم ماشین لرنینگ

 

یادگیری استقرایی

 

این تئوری کلی در پس یادگیری تحت نظارت در ماشین لرنینگ است. یادگیری استقرایی چیست؟

از منظر یادگیری استقرایی، به ما نمونه های ورودی (x) و نمونه های خروجی (f(x)) داده می شود و مسئله تخمین عملکرد (f) است. به طور خاص، مسئله این است که از نمونه ها و نگاشت تعمیم داده شود تا برای تخمین خروجی نمونه های جدید در آینده مفید باشد. در عمل تخمین عملکرد تقریبا همیشه خیلی سخت است، بنابراین ما به دنبال تقریب های بسیار خوبی از عملکرد هستیم.

 

برخی از نمونه های عملی استقرا عبارتند از:

 

۱- ارزیابی ریسک اعتبار.

  1. x خصوصیات مشتری است.
  2. f(x) اعتباری است که تأیید شده است یا خیر.

۲- تشخیص بیماری.

  1. x علائم بیمار است.
  2. f(x) بیماری است که از آن رنج می برند.

۳- تشخیص چهره.

  1. x حالتی از چهره مردم است.
  2. f(x) اختصاص دادن نام به چهره است.

۴- فرمان اتوماتیک.

  1. x تصاویر مشخصی از یک دوربین جلوی ماشین است.
  2. f(x) درجه چرخش فرمان است.

 

مفاهیم ماشین لرنینگ

 

چه زمانی باید از یادگیری استقرایی استفاده کنید؟

 

مشکلاتی وجود دارد پیرامون ماشین لرنینگ، در جایی که یادگیری استقرایی ایده خوبی نیست. مهم است که چه موقع باید استفاده شود و چه زمانی نباید از یادگیری ماشین تحت نظارت استفاده کرد.

 

۴ مسئله ای که در آنها یادگیری استقرایی می تواند ایده خوبی باشد:

 

  1. مشکلاتی که در آن هیچ متخصص انسانی وجود ندارد. اگر مردم جواب را نمی دانند نمی توانند برای حل آن برنامه بنویسند. این ها حوزه های کشف حقیقت هستند.
  2. انسان ها می توانند این وظیفه را انجام دهند اما هیچ کس نمی تواند نحوه انجام آن را توصیف کند. مشکلاتی وجود دارد که در آن انسان ها می توانند کارهایی را انجام دهند که کامپیوتر قادر به انجام آنها نیست یا آنها را به خوبی انجام نمی دهد. به عنوان مثال می توان به دوچرخه سواری یا راندن اتومبیل اشاره کرد.
  3. مشکلاتی که عملکرد مطلوب به طور مکرر تغییر می کند. انسان ها می توانند آن را توصیف کنند و می توانند برای انجام آن برنامه بنویسند، اما مشکل اغلب تغییر می کند. این مقرون به صرفه نیست. به عنوان مثال می توان به بازار سهام اشاره کرد.
  4. مشکلاتی که هر کاربر به عملکرد سفارشی (اختصاصی) نیاز دارد. نوشتن یک برنامه سفارشی برای هر کاربر مقرون به صرفه نیست. مثال آن توصیه های فیلم ها یا کتابها در Netflix یا Amazon است.

 

مفاهیم ماشین لرنینگ

 

ماهیت یادگیری استقرایی

 

ما می توانیم برنامه ای بنویسیم که کاملا برای داده هایی که داریم کار کند. این عملکرد سازگاری حداکثر خواهد داشت. اما ما نمی دانیم که چقدر روی داده های جدید خوب کار خواهد کرد، احتمالا بسیار بد خواهد بود زیرا ممکن است دیگر هرگز نمونه های مشابه را نبینیم. پس باید در حوزه ماشین لرنینگ به آن توجه کرد.

گاهی داده ها کافی نیستند. می توانید هر چیزی را که دوست دارید پیش بینی کنید. و این بی تجربگی است و فرض نمی کند هیچ مشکلی وجود داشته باشد. در عمل ما بی تجربه (خام) نیستیم. یک مشکل اساسی وجود دارد، ما علاقه مند به تقریبی دقیق از عملکرد هستیم. تعداد تقسیم بندی های احتمالی دو برابر در تعداد حالت های ورودی وجود دارد. یافتن تقریبی مناسب برای عملکرد بسیار دشوار است.

فرضیه های مختلفی وجود دارد که می توانیم آنها را امتحان کنیم. این شکلی است که ممکن است راه حل داشته باشد یا ارائه دهد. ما نمی توانیم بفهمیم که برای مشکل ما کدام مناسب تر از قبلی ها است. ما باید از آزمایش ها استفاده کنیم تا بفهمیم چه چیزی در این مسئله موثر است.

 

دو دیدگاه در مورد یادگیری استقرایی:

 

  1. یادگیری رفع عدم اطمینان است. داشتن داده ها بعضی عدم قطعیت ها را برطرف می کند. با انتخاب یک کلاس از فرضیه ها، عدم اطمینان بیشتری را از بین می بریم.
  2. یادگیری حدس زدن یک کلاس فرضیه خوب و کوچک است. این نیاز به حدس زدن دارد. ما نمی دانیم چه راه حلی باید در یک فرآیند آزمایش و خطا استفاده شود. اگر حوزه را با اطمینان می دانستید، نیازی به یادگیری نداشتید. اما ما در تاریکی حدس نمی زنیم.

 

ممکن است در برخی آنالیز های خود در ماشین لرنینگ اشتباه کنید.

 

  1. دانش قبلی ما می تواند اشتباه باشد.
  2. حدس ما از کلاس فرضیه می تواند اشتباه باشد.

 

در عمل ما با یک کلاس فرضیه کوچک شروع می کنیم و کلاس فرضیه را به آرامی رشد می دهیم تا زمانی که نتیجه خوبی بگیریم.

 

مفاهیم ماشین لرنینگ

 

چارچوبی برای یادگیری استقرایی

 

اصطلاحات مورد استفاده در ماشین لرنینگ:

 

  1. مثال آموزشی: نمونه ای از x شامل خروجی آن از تابع هدف
  2. تابع هدف: عملکرد نگاشت f از x به f (x)
  3. فرضیه: تقریب f، یک تابع کاندید شده.
  4. مفهوم: یک تابع هدف بولین، مثالهای مثبت و مثالهای منفی برای مقادیر کلاس ۱/۰٫
  5. طبقه بندی: برنامه یادگیری یک طبقه بندی را تولید می کند که می تواند برای طبقه بندی استفاده شود.
  6. فراگیر: فرایندی که طبقه بندی کننده را ایجاد می کند.
  7. فضای فرضیه: مجموعه تقریب های احتمالی f که الگوریتم می تواند ایجاد کند.
  8. فضای نسخه: زیر مجموعه فضای فرضیه که با داده های مشاهده شده مطابقت دارد.

 

مسائل کلیدی در ماشین لرنینگ:

 

  1. فضای فرضیه خوب چیست؟
  2. چه الگوریتم هایی با آن فضا کار می کنند؟
  3. برای بهینه سازی دقت در داده های دیده نشده چه کاری می توانم انجام دهم؟
  4. چگونه می توان به مدل اطمینان داشت؟
  5. آیا مشکلات یادگیری وجود دارد که از نظر محاسباتی غیرقابل حل باشد؟
  6. چگونه می توانیم مشکلات کاربردی را به عنوان مشکلات ماشین لرنینگ فرموله کنیم؟

 

موارد قابل توجه:

 

۳ نگرانی برای انتخاب محیط فرضی فرضیه ارائه شده در ماشین لرنینگ وجود دارد:

 

  1. اندازه: تعداد فرضیه های انتخابی
  2. تصادفی بودن: تصادفی بودن یا قطعی بودن
  3. پارامتر: تعداد و نوع پارامترها

 

۳ ویژگی وجود دارد که می توانید الگوریتمی را انتخاب کنید:

 

۱- روش جستجو

  1. محاسبه مستقیم: بدون جستجو، فقط آنچه را که لازم است محاسبه کنید.
  2. محلی: برای اصلاح فرضیه در فضای فرضیه جستجو کنید.
  3. سازنده: فرضیه را قطعه قطعه بسازید.

۲- زمان سنجی

  1. مشتاق: یادگیری از پیش (جلو تر) انجام می شود. بیشتر الگوریتم ها مشتاق هستند.
  2. تنبل: یادگیری در زمان مورد نیاز انجام می شود

۳- آنلاین در برابر دسته

  1. بصورت آنلاین: یادگیری براساس هر الگویی که مشاهده می شود انجام می شود.
  2. دسته ای: یادگیری بر بستر گروه های مختلف الگوها. بیشتر الگوریتم ها دسته ای هستند.

 

مفاهیم ماشین لرنینگ

 

 

احد الوندی

فارغ التحصیل مهندسی برق – گرایش الکترونیک

فعال در زمینه Data Science، هوش مصنوعی و اتوماسیون صنعتی

مدرس زبان برنامه نویسی Python و نرم افزار MATLAB

https://www.linkedin.com/in/ahadalvandi

ahadalvandi

    نوشته‌های مرتبط

    دیدگاه‌ها

    *
    *

      سپهر پاسخ

      سلام، من تمام مطالب این موضوع رو تا اینجا خوندم.
      خیلی خوب و عالی توضیح دادین. ممنون از شما.