یادگیری ماشین در بسیاری از صنایع در انجام وظایف خودکار بسیار مفید است که قبلاً به نیروی انسانی نیاز داشت ، چنین کاربردی از ML پیش بینی می کند که آیا تجارت خاص سودآور خواهد بود یا خیر.
در این مقاله ، ما یاد خواهیم گرفت که چگونه سیگنالی را پیش بینی کنیم که نشان می دهد خرید سهام خاص با استفاده از ML مفید خواهد بود یا خیر.
بیایید با وارد کردن برخی از کتابخانه ها که برای اهداف مختلفی استفاده می شود که بعداً در این مقاله توضیح داده می شود ، شروع کنیم.
وارد کردن کتابخانه
کتابخانه های پایتون ، رسیدگی به داده ها و انجام کارهای معمولی و پیچیده با یک خط کد را برای ما بسیار آسان می کنند.
- - این کتابخانه به بارگذاری قاب داده در قالب آرایه 2D کمک می کند و دارای چندین کارکرد برای انجام وظایف تجزیه و تحلیل در یک GO است.- آرایه های Numpy بسیار سریع هستند و می توانند در مدت زمان بسیار کوتاهی محاسبات بزرگی را انجام دهند./ Seabo - از این کتابخانه برای ترسیم تجسم استفاده می شود.
- Sklea-این ماژول شامل چندین کتابخانه است که دارای توابع از پیش اجرا شده برای انجام وظایف از پیش پردازش داده ها تا توسعه و ارزیابی مدل هستند.- این حاوی الگوریتم یادگیری دستگاه تقویت کننده شیب شدید است که یکی از الگوریتم ها است که به ما در دستیابی به دقت بالا در پیش بینی ها کمک می کند.
پایتون 3
وارد کردن مجموعه داده
مجموعه داده ای که در اینجا برای انجام تجزیه و تحلیل و ساخت یک مدل پیش بینی شده از داده های قیمت بیت کوین استفاده خواهیم کرد. ما از داده های OHLC ("باز" ، "بالا" ، "کم" ، "نزدیک") از 17 ژوئیه 2014 تا 29 دسامبر 2022 استفاده خواهیم کرد که 8 سال برای قیمت بیت کوین است.
پایتون 3
خروجی:

پنج ردیف اول داده ها
پایتون 3
خروجی:
از این طریق ، ما می دانیم که 2904 ردیف داده در دسترس است و برای هر سطر ، 7 ویژگی یا ستون مختلف داریم.
پایتون 3
خروجی:

اقدامات آماری توصیفی داده ها
پایتون 3
خروجی:

تجزیه و تحلیل داده های اکتشافی
EDA رویکردی برای تجزیه و تحلیل داده ها با استفاده از تکنیک های بصری است. از آن برای کشف روندها و الگوهای یا بررسی فرضیات با کمک خلاصه های آماری و نمایش های گرافیکی استفاده می شود.
در حین انجام EDA از داده های قیمت بیت کوین ، ما تجزیه و تحلیل خواهیم کرد که چگونه قیمت های رمزنگاری شده در مدت زمان حرکت کرده است و چگونه پایان چهارم بر قیمت ارز تأثیر می گذارد.
پایتون 3
خروجی:

تغییر در قیمت cryptocurrency
قیمت سهام بیت کوین روند صعودی را نشان می دهد که توسط طرح قیمت بسته شدن سهام به تصویر کشیده شده است.
پایتون 3
خروجی:
از اینجا می توان نتیجه گرفت که تمام ردیف های ستون های "Close" و "Adj Close" داده های یکسانی دارند. بنابراین ، داشتن داده های اضافی در مجموعه داده به این کمک نمی شود ، ما این ستون را قبل از تجزیه و تحلیل بیشتر رها خواهیم کرد.
پایتون 3
حال بیایید طرح توزیع را برای ویژگی های مداوم ارائه شده در مجموعه داده ترسیم کنیم اما قبل از حرکت بیشتر ، در صورت وجود در قاب داده ، مقادیر تهی را بررسی کنیم.
پایتون 3
خروجی:

جمع ستون مقادیر تهی عاقلانه
این بدان معنی است که هیچ مقادیر تهی در مجموعه داده های ارائه شده وجود ندارد.
پایتون 3
خروجی:

طرح توزیع داده های OHLC
پایتون 3
خروجی:

Boxplot از داده های OHLC
در داده های زیادی وجود دارد که به این معنی است که قیمت سهام در یک دوره زمانی بسیار کوتاه بسیار متفاوت بوده است. بیایید این کار را با کمک یک بارپلوت بررسی کنیم.
مهندسی ویژگی
مهندسی ویژگی به استخراج برخی از ویژگی های ارزشمند از ویژگی های موجود کمک می کند. این ویژگی های اضافی گاهی اوقات به افزایش عملکرد مدل کمک می کند و مطمئناً به به دست آوردن بینش عمیق تر از داده ها کمک می کند.
پایتون 3
خروجی:

پنج ردیف اول داده ها
اکنون ما سه ستون دیگر یعنی "روز" ، "ماه" و "سال" داریم که این سه نفر از ستون "تاریخ" گرفته شده اند که در ابتدا در داده ها ارائه شده است.
پایتون 3
خروجی:

بارپلوت از میانگین قیمت سال بیت کوین عاقلانه
در اینجا می توانیم مشاهده کنیم که چرا تعداد زیادی از دور در داده ها وجود دارد زیرا قیمت بیت کوین در سال 2021 منفجر شده است.
پایتون 3
خروجی:

پنج ردیف اول داده ها
پایتون 3
در بالا ستون های دیگری اضافه کرده ایم که به آموزش مدل ما کمک می کند. ما ویژگی هدف را اضافه کرده ایم که یک سیگنال است که آیا خرید یا خیر ، ما مدل خود را آموزش خواهیم داد تا این موضوع را فقط پیش بینی کنیم. اما قبل از ادامه کار ، بررسی کنیم که آیا هدف متعادل است یا از نمودار پای استفاده نمی کند.
پایتون 3
خروجی:

نمودار پای برای توزیع داده ها در دو برچسب
وقتی ویژگی هایی را به مجموعه داده خود اضافه می کنیم ، باید اطمینان حاصل کنیم که هیچ ویژگی بسیار همبستگی وجود ندارد زیرا آنها در فرآیند یادگیری الگوریتم کمکی نمی کنند.
پایتون 3
خروجی:

نقشه گرما برای یافتن ویژگی های بسیار همبسته
از میانه گرمای فوق ، می توان گفت که بین OHLC ارتباط زیادی وجود دارد که کاملاً واضح است ، و ویژگی های اضافه شده با یکدیگر یا ویژگی های قبلاً ارائه شده بسیار همبستگی ندارند و این بدان معنی است که ما خوب هستیم که برویم و مدل خود را بسازیم.
پایتون 3
خروجی:
پس از انتخاب ویژگی ها برای آموزش مدل در ما باید داده ها را عادی کنیم زیرا داده های عادی منجر به آموزش پایدار و سریع مدل می شوند. پس از آن کل داده ها به دو بخش با نسبت 90/10 تقسیم شده است ، که می توانیم عملکرد مدل خود را بر روی داده های غیب ارزیابی کنیم.
توسعه و ارزیابی مدل
اکنون زمان آموزش برخی از مدلهای پیشرفته یادگیری ماشین (رگرسیون لجستیک ، دستگاه بردار پشتیبانی ، xgbclassifier) و سپس بر اساس عملکرد آنها در داده های آموزش و اعتبار سنجی است که ما انتخاب خواهیم کرد که کدام مدل ML در خدمت هدف است. در دست بهتر
برای متریک ارزیابی ، ما از منحنی ROC-AUC استفاده خواهیم کرد اما به همین دلیل به جای پیش بینی احتمال سخت 0 یا 1 است که دوست داریم این احتمالات نرم را که مقادیر مداوم بین 0 تا 1 است و با احتمالات نرم پیش بینی کنیم.، از منحنی ROC-AUC به طور کلی برای اندازه گیری صحت پیش بینی ها استفاده می شود.< Pan> پس از انتخاب ویژگی ها برای آموزش مدل در ما باید داده ها را عادی کنیم زیرا داده های عادی منجر به آموزش پایدار و سریع مدل می شوند. پس از آن کل داده ها به دو بخش با نسبت 90/10 تقسیم شده است ، که می توانیم عملکرد مدل خود را بر روی داده های غیب ارزیابی کنیم.
معامله ارز ماتیک...
ما را در سایت معامله ارز ماتیک دنبال می کنید
برچسب : نویسنده : لیلا حاتمی بازدید : 54 تاريخ : يکشنبه 6 فروردين 1402 ساعت: 1:55