🔶رانش مفهوم یا گذار مفهوم
(Concept Drift)
تغییر تدریجی مفهوم_Concept Drift در یادگیری ماشین به معنی تغییر ویژگیهای آماری متغیر مورد مطالعه است به طوری که مدل در طول زمان به صورت پیشبینی نشدهای تغییر میکند. رانش مفهوم باعث میشود که پیشبینیها با گذر زمان دقت خود را از دست بدهند.
✅ این پدیده میتواند باعث کاهش دقت و عملکرد مدل یادگیری ماشین شود، زیرا روابطی که مدل در زمان آموزش یاد گرفته است دیگر با الگوهای دادههای جدید مطابقت ندارند.
🔶 انواع تغییر مفهوم Concept Drift
1-تغییر ناگهانی: توزیع دادهها به طور ناگهانی تغییر میکند.
مثال: تغییر ناگهانی در سیاستهای یک کسبوکار که رفتار مشتریان را تحت تأثیر قرار میدهد.
2- تغییر تدریجی: توزیع دادهها به مرور زمان تغییر میکند.
مثال: تغییرات آرام در ترجیحات مشتریان به دلیل روندهای بازار.
3-تغییر دورهای: الگوها در بازههای زمانی مختلف تکرار میشوند، اغلب به صورت فصلی.
مثال: تغییرات فصلی در روند فروش محصولات. و در این حالت مدلهای ثابت نمیتوانند در چرخههای تکراری پیشبینی دقیقی داشته باشند.
4-تغییر پیوسته: تغییرات تدریجی و مداوم در توزیع دادهها.
مثال: تغییر آرام در دادههای حسگرها به دلیل فرسودگی تجهیزات. که در این حالت مدل به مرور زمان منسوخ میشود.
برای مقابله با رانش دادهها روشهای مختلف و متعددی موجود است. برای مثال میتوان الگوریتم را با استفاده از روشهای یادگیری آنلاین بر روی دادهها برازش کنیم. همچنین با استفاده از راهکارهای آماری و مقایسهی توزیع دادهها با روشهایی مانند
روش KL Divergence
یا جنسون شنون (Jenson Shannon نمونهای از دادههای جدید را به صورت دورهای با دادههای قبلی (که الگوریتم بر روی آنها یادگرفته شده است)، مقایسه کرده تا بفهمیم که آیا دادهها دچار رانش شده است یا خیر. با این کار میتوانیم به صورت دورهای یک مجموعهی دادهی آموزشی ایجاد کرده و الگوریتم را هر چند وقت یک بار بر روی دادههای جدید برازش کنیم.
🔺سایر روشهای مقابله: بازآموزی دورهای مدل Periodic Model Retraining، بهروزرسانی مداوم پارامترهای مدل با ورود دادههای جدید مانند الگوریتم گرادیان نزولی تصادفی (SGD)، آموزش مدل با استفاده از یک پنجره متحرک از دادههای اخیر Window-based Approaches
#یادگیری_ماشین
#concept_drift
@datalook_ir
(Concept Drift)
تغییر تدریجی مفهوم_Concept Drift در یادگیری ماشین به معنی تغییر ویژگیهای آماری متغیر مورد مطالعه است به طوری که مدل در طول زمان به صورت پیشبینی نشدهای تغییر میکند. رانش مفهوم باعث میشود که پیشبینیها با گذر زمان دقت خود را از دست بدهند.
✅ این پدیده میتواند باعث کاهش دقت و عملکرد مدل یادگیری ماشین شود، زیرا روابطی که مدل در زمان آموزش یاد گرفته است دیگر با الگوهای دادههای جدید مطابقت ندارند.
🔶 انواع تغییر مفهوم Concept Drift
1-تغییر ناگهانی: توزیع دادهها به طور ناگهانی تغییر میکند.
مثال: تغییر ناگهانی در سیاستهای یک کسبوکار که رفتار مشتریان را تحت تأثیر قرار میدهد.
2- تغییر تدریجی: توزیع دادهها به مرور زمان تغییر میکند.
مثال: تغییرات آرام در ترجیحات مشتریان به دلیل روندهای بازار.
3-تغییر دورهای: الگوها در بازههای زمانی مختلف تکرار میشوند، اغلب به صورت فصلی.
مثال: تغییرات فصلی در روند فروش محصولات. و در این حالت مدلهای ثابت نمیتوانند در چرخههای تکراری پیشبینی دقیقی داشته باشند.
4-تغییر پیوسته: تغییرات تدریجی و مداوم در توزیع دادهها.
مثال: تغییر آرام در دادههای حسگرها به دلیل فرسودگی تجهیزات. که در این حالت مدل به مرور زمان منسوخ میشود.
برای مقابله با رانش دادهها روشهای مختلف و متعددی موجود است. برای مثال میتوان الگوریتم را با استفاده از روشهای یادگیری آنلاین بر روی دادهها برازش کنیم. همچنین با استفاده از راهکارهای آماری و مقایسهی توزیع دادهها با روشهایی مانند
روش KL Divergence
یا جنسون شنون (Jenson Shannon نمونهای از دادههای جدید را به صورت دورهای با دادههای قبلی (که الگوریتم بر روی آنها یادگرفته شده است)، مقایسه کرده تا بفهمیم که آیا دادهها دچار رانش شده است یا خیر. با این کار میتوانیم به صورت دورهای یک مجموعهی دادهی آموزشی ایجاد کرده و الگوریتم را هر چند وقت یک بار بر روی دادههای جدید برازش کنیم.
🔺سایر روشهای مقابله: بازآموزی دورهای مدل Periodic Model Retraining، بهروزرسانی مداوم پارامترهای مدل با ورود دادههای جدید مانند الگوریتم گرادیان نزولی تصادفی (SGD)، آموزش مدل با استفاده از یک پنجره متحرک از دادههای اخیر Window-based Approaches
#یادگیری_ماشین
#concept_drift
@datalook_ir