پیش بینی قیمت بیت کوین با استفاده از یادگیری ماشین در پایتون

ساخت وبلاگ

یادگیری ماشین در بسیاری از صنایع در انجام وظایف خودکار بسیار مفید است که قبلاً به نیروی انسانی نیاز داشت ، چنین کاربردی از ML پیش بینی می کند که آیا تجارت خاص سودآور خواهد بود یا خیر.

در این مقاله ، ما یاد خواهیم گرفت که چگونه سیگنالی را پیش بینی کنیم که نشان می دهد خرید سهام خاص با استفاده از ML مفید خواهد بود یا خیر.

بیایید با وارد کردن برخی از کتابخانه ها که برای اهداف مختلفی استفاده می شود که بعداً در این مقاله توضیح داده می شود ، شروع کنیم.

وارد کردن کتابخانه

کتابخانه های پایتون ، رسیدگی به داده ها و انجام کارهای معمولی و پیچیده با یک خط کد را برای ما بسیار آسان می کنند.

  • - این کتابخانه به بارگذاری قاب داده در قالب آرایه 2D کمک می کند و دارای چندین کارکرد برای انجام وظایف تجزیه و تحلیل در یک GO است.- آرایه های Numpy بسیار سریع هستند و می توانند در مدت زمان بسیار کوتاهی محاسبات بزرگی را انجام دهند./ Seabo - از این کتابخانه برای ترسیم تجسم استفاده می شود.
  • Sklea-این ماژول شامل چندین کتابخانه است که دارای توابع از پیش اجرا شده برای انجام وظایف از پیش پردازش داده ها تا توسعه و ارزیابی مدل هستند.- این حاوی الگوریتم یادگیری دستگاه تقویت کننده شیب شدید است که یکی از الگوریتم ها است که به ما در دستیابی به دقت بالا در پیش بینی ها کمک می کند.

پایتون 3

وارد کردن مجموعه داده

مجموعه داده ای که در اینجا برای انجام تجزیه و تحلیل و ساخت یک مدل پیش بینی شده از داده های قیمت بیت کوین استفاده خواهیم کرد. ما از داده های OHLC ("باز" ، "بالا" ، "کم" ، "نزدیک") از 17 ژوئیه 2014 تا 29 دسامبر 2022 استفاده خواهیم کرد که 8 سال برای قیمت بیت کوین است.

پایتون 3

خروجی:

First five rows of the data

پنج ردیف اول داده ها

پایتون 3

خروجی:

از این طریق ، ما می دانیم که 2904 ردیف داده در دسترس است و برای هر سطر ، 7 ویژگی یا ستون مختلف داریم.

پایتون 3

خروجی:

Descriptive statistical measures of the data

اقدامات آماری توصیفی داده ها

پایتون 3

خروجی:

Basic info about the data columns

تجزیه و تحلیل داده های اکتشافی

EDA رویکردی برای تجزیه و تحلیل داده ها با استفاده از تکنیک های بصری است. از آن برای کشف روندها و الگوهای یا بررسی فرضیات با کمک خلاصه های آماری و نمایش های گرافیکی استفاده می شود.

در حین انجام EDA از داده های قیمت بیت کوین ، ما تجزیه و تحلیل خواهیم کرد که چگونه قیمت های رمزنگاری شده در مدت زمان حرکت کرده است و چگونه پایان چهارم بر قیمت ارز تأثیر می گذارد.

پایتون 3

خروجی:

Variation in the price of crypto currency

تغییر در قیمت cryptocurrency

قیمت سهام بیت کوین روند صعودی را نشان می دهد که توسط طرح قیمت بسته شدن سهام به تصویر کشیده شده است.

پایتون 3

خروجی:

از اینجا می توان نتیجه گرفت که تمام ردیف های ستون های "Close" و "Adj Close" داده های یکسانی دارند. بنابراین ، داشتن داده های اضافی در مجموعه داده به این کمک نمی شود ، ما این ستون را قبل از تجزیه و تحلیل بیشتر رها خواهیم کرد.

پایتون 3

حال بیایید طرح توزیع را برای ویژگی های مداوم ارائه شده در مجموعه داده ترسیم کنیم اما قبل از حرکت بیشتر ، در صورت وجود در قاب داده ، مقادیر تهی را بررسی کنیم.

پایتون 3

خروجی:

Sum of null values column wise

جمع ستون مقادیر تهی عاقلانه

این بدان معنی است که هیچ مقادیر تهی در مجموعه داده های ارائه شده وجود ندارد.

پایتون 3

خروجی:

Distribution plot of the OHLC data

طرح توزیع داده های OHLC

پایتون 3

خروجی:

Boxplot of the OHLC data

Boxplot از داده های OHLC

در داده های زیادی وجود دارد که به این معنی است که قیمت سهام در یک دوره زمانی بسیار کوتاه بسیار متفاوت بوده است. بیایید این کار را با کمک یک بارپلوت بررسی کنیم.

مهندسی ویژگی

مهندسی ویژگی به استخراج برخی از ویژگی های ارزشمند از ویژگی های موجود کمک می کند. این ویژگی های اضافی گاهی اوقات به افزایش عملکرد مدل کمک می کند و مطمئناً به به دست آوردن بینش عمیق تر از داده ها کمک می کند.

پایتون 3

خروجی:

First five rows of the data

پنج ردیف اول داده ها

اکنون ما سه ستون دیگر یعنی "روز" ، "ماه" و "سال" داریم که این سه نفر از ستون "تاریخ" گرفته شده اند که در ابتدا در داده ها ارائه شده است.

پایتون 3

خروجی:

Barplot of the mean price of the bitcoin year wise

بارپلوت از میانگین قیمت سال بیت کوین عاقلانه

در اینجا می توانیم مشاهده کنیم که چرا تعداد زیادی از دور در داده ها وجود دارد زیرا قیمت بیت کوین در سال 2021 منفجر شده است.

پایتون 3

خروجی:

First five rows of the data

پنج ردیف اول داده ها

پایتون 3

در بالا ستون های دیگری اضافه کرده ایم که به آموزش مدل ما کمک می کند. ما ویژگی هدف را اضافه کرده ایم که یک سیگنال است که آیا خرید یا خیر ، ما مدل خود را آموزش خواهیم داد تا این موضوع را فقط پیش بینی کنیم. اما قبل از ادامه کار ، بررسی کنیم که آیا هدف متعادل است یا از نمودار پای استفاده نمی کند.

پایتون 3

خروجی:

Pie chart for data distribution across two labels

نمودار پای برای توزیع داده ها در دو برچسب

وقتی ویژگی هایی را به مجموعه داده خود اضافه می کنیم ، باید اطمینان حاصل کنیم که هیچ ویژگی بسیار همبستگی وجود ندارد زیرا آنها در فرآیند یادگیری الگوریتم کمکی نمی کنند.

پایتون 3

خروجی:

Heatmap to find the highly correlated features

نقشه گرما برای یافتن ویژگی های بسیار همبسته

از میانه گرمای فوق ، می توان گفت که بین OHLC ارتباط زیادی وجود دارد که کاملاً واضح است ، و ویژگی های اضافه شده با یکدیگر یا ویژگی های قبلاً ارائه شده بسیار همبستگی ندارند و این بدان معنی است که ما خوب هستیم که برویم و مدل خود را بسازیم.

پایتون 3

خروجی:

پس از انتخاب ویژگی ها برای آموزش مدل در ما باید داده ها را عادی کنیم زیرا داده های عادی منجر به آموزش پایدار و سریع مدل می شوند. پس از آن کل داده ها به دو بخش با نسبت 90/10 تقسیم شده است ، که می توانیم عملکرد مدل خود را بر روی داده های غیب ارزیابی کنیم.

توسعه و ارزیابی مدل

اکنون زمان آموزش برخی از مدلهای پیشرفته یادگیری ماشین (رگرسیون لجستیک ، دستگاه بردار پشتیبانی ، xgbclassifier) و سپس بر اساس عملکرد آنها در داده های آموزش و اعتبار سنجی است که ما انتخاب خواهیم کرد که کدام مدل ML در خدمت هدف است. در دست بهتر

برای متریک ارزیابی ، ما از منحنی ROC-AUC استفاده خواهیم کرد اما به همین دلیل به جای پیش بینی احتمال سخت 0 یا 1 است که دوست داریم این احتمالات نرم را که مقادیر مداوم بین 0 تا 1 است و با احتمالات نرم پیش بینی کنیم.، از منحنی ROC-AUC به طور کلی برای اندازه گیری صحت پیش بینی ها استفاده می شود.< Pan> پس از انتخاب ویژگی ها برای آموزش مدل در ما باید داده ها را عادی کنیم زیرا داده های عادی منجر به آموزش پایدار و سریع مدل می شوند. پس از آن کل داده ها به دو بخش با نسبت 90/10 تقسیم شده است ، که می توانیم عملکرد مدل خود را بر روی داده های غیب ارزیابی کنیم.

معامله ارز ماتیک...
ما را در سایت معامله ارز ماتیک دنبال می کنید

برچسب : نویسنده : لیلا حاتمی بازدید : 83 تاريخ : يکشنبه 6 فروردين 1402 ساعت: 1:55