مدل دنیای واقعی برای پیش بینی قیمت بیت کوین

ساخت وبلاگ

Cryptocurrency نوعی از دارایی های دیجیتالی است که در نتیجه پیشرفت در فناوری مالی تکامل یافته است و فرصت تحقیق قابل توجهی را ارائه داده است. الگوریتم های زیادی برای پیش بینی قیمت برای ارزهای رمزنگاری مانند LSTM و ARIMA وجود دارد. با این حال ، نکته منفی این است که درک RNN های مبتنی بر LSTM دشوار است و به دست آوردن شهود در رفتار آنها دشوار است. به منظور تولید نتایج مناسب ، تنظیم سختگیرانه Hyperparameter نیز ضروری است. علاوه بر این ، ارزهای رمزپایه دقیقاً به داده های گذشته پایبند نیستند و الگوهای سریع تغییر می کنند و باعث کاهش دقت پیش بینی ها می شوند. پیش بینی قیمت cryptocurrency به دلیل نوسانات قیمت و پویایی دشوار است. از آنجا که داده ها پویا و به شدت تحت تأثیر فصول مختلف قرار دارند ، مدل Arima قادر به کنترل داده های فصلی نیست. به منظور ارائه پیش بینی قیمت بهتر برای معامله گران Crypto ، مدل جدیدی لازم است. هدف از این مطالعه استفاده از مدل FBPROPHET به عنوان مدل کلیدی است زیرا در مقایسه با LSTM و ARIMA علاوه بر این ، مشکلات تولید شده در مدل LSTM و ARIMA را از بین می برد و ضمن تجزیه و تحلیل داده های رمزنگاری. این مطالعه روشی را برای پیش بینی قیمت آینده بیت کوین ارائه می دهد که فقط به دلیل فصلی بودن در داده های تاریخی فقط به داده های گذشته متکی نیست. بنابراین ، پس از قرار دادن فصلی و هموار سازی ، این مدل ساخته شده است که می تواند برای موارد استفاده در دنیای واقعی مفید باشد. در مورد ارزهای رمزنگاری که داده های تاریخی کمتری در دسترس است و یافتن الگوی آن دشوار است ، روش پیشنهادی می تواند به راحتی این نوع مشکلات را برطرف کند. تفاوت کلی بین مقادیر پیش بینی شده و واقعی نسبت به سایر مدل ها حتی پس از در دسترس بودن داده های فصلی کم است.

معرفی

ارزهای رمزنگاری ارزهای مجازی یا دیجیتالی هستند که در سیستم های مالی امروز استفاده می شوند. از آنجا که هیچ دولت ، مقام مرکزی یا بانکی این ارزهای مجازی را صادر نمی کند ، اینها غیر متمرکز هستند. تمام ارزهای رمزپایه مبتنی بر فناوری blockchain است که بسیار پیچیده است و سعی می کند داده ها را به گونه ای ذخیره کند که سخت و فراتر از انتظارات هک و اصلاح باشد. رمزنگاری بیشتر این ارزها را تأمین می کند و ایجاد ارزهای رمزنگاری کلاهبرداری را دشوار می کند. ارزهای رمزپایه هنوز در مراحل ابتدایی خود هستند و نمی توان گفت که آیا این موارد می تواند به طور گسترده در بازارهای جهانی پذیرفته شود ، اما السالوادور اولین کشوری بود که در نوامبر 2021 از بیت کوین به عنوان پول قانونی در کنار دلار آمریکا استفاده کرد.

یک دسته از ارزهای رمزنگاری شده در بازار دیجیتال وجود دارد. در چنین ارزهای رمزنگاری شده بیت کوین مشهورترین است و تحت تأثیر متغیرهای خارجی مانند سایتهای اجتماعی ، داده های دیجیتال ، تجزیه و تحلیل بازار و غیره قرار دارد. این نخستین بار توسط ناکاموتو در سال 2008 معرفی شد (Giudici ، Milne & Vinogradov ، 2020). معاملات همتا به لطف فناوری blockchain امکان پذیر است. Blockchain ، فناوری که زیر نظر سیستم رمزنگاری بیت کوین است ، برای اطمینان از امنیت و حفظ حریم خصوصی در بخش های مختلف ، شامل IoT بسیار مهم است (Arias-Oliva ، Pelegrín-Borondo & Matías-Clavero ، 2019). این اساساً یک رکورد دیجیتالی توزیع شده از معاملات است که کل شبکه سیستم های رایانه ای را تشکیل می دهد که blockchain را تشکیل می دهند. اولین مؤلفه blockchain یک معامله است و دوم یک بلوک است (Jaquart ، Dann & Weinhardt ، 2021 ؛ Golbabai & Ezazipour ، 2019). فعالیت شرکت کننده توسط معامله نشان داده شده است ، و بلوک یک جمع آوری داده است که معامله را ذخیره می کند و همچنین اطلاعات اضافی مانند دنباله مناسب و زمان بندی ایجاد را ذخیره می کند.

بازار cryptocurrency در حال حاضر جذاب ترین دامنه برای گمانه زنی های مالی است. بسیاری از افراد با حدس و گمان در بازارهای دیجیتال پول زیادی به دست آورده اند ، و همچنین فرآیند سرمایه گذاری بازاریابی که پر از مشکلات پنهان شده است که هنوز هم در بیت کوین ها ، اتریوم و غیره وقف شده است (Giudici et al. ، 2020 ؛ Arias-Oliva et al. ، 2019). تعداد الگوریتم های یادگیری ماشین برای استفاده برای کاهش این خطرات و همچنین مجموعه ای جامع از خصوصیات پیش بینی بازار ممکن است (Jaquart et al. ، 2021). با توجه به ظرفیت انتخاب پویا از تعداد بالقوه عظیمی از خصوصیات و درک همبستگی های پیچیده و با ابعاد بالا بین ویژگی ها و اهداف ، رویکردهای یادگیری ماشین در این بخش محبوبیت بیشتری پیدا کرده اند (Golbabai & Ezazipour ، 2019 ؛ Ezazipour & Golbabai ، 2020)بشرهوش مصنوعی با تکنیک های یادگیری ماشین به دلیل واریانس در ظرفیت پیش بینی در هر سکه سباستیئو و گودینیو (2021) جذاب است. ارزهای کم حجم کمتری نسبت به رمزنگاری های با حجم بالا قابل پیش بینی هستند.

به دلیل نوسانات قیمت و بی ثباتی ، قیمت رمزنگاری برای پیش بینی سخت است. این خلاء در این زمینه با مقایسه چندین مدل یادگیری ماشین برای پیش بینی حرکات بازار از مهمترین cryptocurrency - citcoin پر می شود. سرمایه گذاری در بیت کوین با سرمایه گذاری در سهام قابل مقایسه است: هیچ یک از عوامل خطر که نمی تواند مذاکرات و تغییر قیمت سهام مربوط به ارزهای رمزنگاری شود.

در مورد سهام، پارامترهای مختلفی مانند ارزش P/E، ROE (بازده حقوق صاحبان سهام)، ROCE، EBITDA و غیره برای پیش بینی قیمت سهام وجود دارد، اما در مورد ارزهای رمزنگاری شده، تنها پارامترهای کمی وجود دارد، حرکت قیمت. ماهیت بسیار فرار و پویا است، روندها و الگوی پیچیده هستند و به صورت پویا در مدت زمان کوتاهی تغییر می کنند و فصلی های متعدد با داده های ساعتی، روزانه و هفتگی وجود دارد. بیشتر الگوریتم های معاملاتی به پارامترهای زیادی نیاز دارند، آنها به شدت به داده های تاریخی وابسته هستند، نمی توانند نوسانات بالا و فصلی بودن چندگانه قوی را مدیریت کنند. به دلیل ماهیت بسیار پویا و فرار، ممکن است مشاهدات گم شده و نقاط پرت بزرگ وجود داشته باشد. الگوریتم های مختلفی مانند شبکه های عصبی بازگشتی مبتنی بر ARIMA و LSTM در دسترس هستند، اما همه این ها به پارامترهای زیادی نیاز دارند، RNN های مبتنی بر LSTM به سختی تفسیر می شوند و به دست آوردن شهود در رفتار آنها چالش برانگیز است، این الگوریتم ها برای الگوی طولانی مدت خوب هستند. در صورت تغییر الگوی کریپتو و روند طی چند ساعت. بنابراین نیاز به الگوریتمی وجود دارد که بتواند تمام این مشکلات را برطرف کند و حتی بتواند با تعطیلات شناخته شده از قبل و مشاهدات مفقود و نقاط دورافتاده بزرگ و تأثیر فصلی ناشی از رفتار انسان مقابله کند و بتواند پیش بینی دقیق تری ارائه دهد.

در این مقاله، هدف دستیابی به مدلی برای پیش بینی قیمت بسته شدن بیت کوین به همراه قیمت افتتاحیه بیت کوین، قیمت بالای روز بیت کوین، قیمت پایین روز بیت کوین، حجم روز بیت کوین و سرمایه گذاری بازار بیت کوین در روز خاص با استفاده از الگوریتم های تمایل عمیق است. و مفاهیم مختلف یادگیری ماشینی که می توانند الگوهای پنهان در داده ها را بیابند، آنها را ترکیب کنند و پیش بینی های بسیار دقیق تری انجام دهند. برای دستیابی به هدف، وظایف زیر انجام می شود: الف)

تجزیه و تحلیل داده های اکتشافی همراه با پیش پردازش داده ها

تست آماری برای حذف فصلی و ثابت کردن آن

آماده سازی داده ها، صاف کردن داده ها و تلاش برای تنظیم فصلی. مفهومی مانند تفاوت اغلب استفاده می شود.

ساخت یک مدل سری زمانی که کتابخانه Fbprophet برای آن استفاده می شود.

و در نهایت، اعتبار سنجی متقاطع بر روی مدل انجام می شود.

پس از اعمال تمامی این مراحل، مدل تولید شده به صورت زیر است: 1.

که می تواند تمام ویژگی های مدل های قبلی را انجام دهد.

این نیازی به دانش یا تجربه قبلی زیادی از پیش بینی داده های سری زمانی ندارد، زیرا به طور خودکار روندهای فصلی را در زیر داده ها پیدا می کند و مجموعه ای از پارامترهای «آسان قابل درک» را ارائه می دهد.

این می تواند با تعطیلات شناخته شده از قبل ، مشاهدات از دست رفته و مسافت های بزرگ سروکار داشته باشد.

این می تواند به معنای مشاهدات ساعتی ، روزانه یا هفتگی با فصلی چند فصلی قوی باشد.

هدف اساسی این مدل ها ایجاد یک مدل پیش بینی قابل اعتماد بر اساس قیمت های قبلی بیت کوین است که سرمایه گذاران می توانند به آن اعتماد کنند. این مقاله همچنین سعی در پرداختن به موضوعات معدودی مانند 1. استفاده از تکنیک های یادگیری ماشین در پیش بینی قیمت های رمزنگاری برای سرمایه گذاران و تصمیم گیرندگان دارد. 2. انتخاب بهترین مدل مناسب برای پیش بینی قیمت های cryptocurrency.

بخش بعدی در مورد مطالعه مربوط به ارز رمزنگاری شده است. بخش 3 جزئیات مجموعه داده را ارائه می دهد. روش مفصل در بخش 4 به تفصیل مورد بحث قرار گرفته است که بخش 5 در مورد اجرای و نتایج توضیح داده شده است. بخش 6 بیشتر مربوط به بحث در مورد نتایج است که به دنبال آن نتیجه گیری می شود.

قطعه قطعه

بررسی ادبیات

در دسترس بودن مدل های پیش بینی قیمت برای بیت کوین ها بسیار کمتر است زیرا این یک فناوری مدرن در سناریوی فعلی است (Hitam & Ismail ، 2018). مدل های سری زمانی با داده های سری زمانی روزانه ، 10 دقیقه و فواصل 10 ثانیه ای تعامل دارند. این مدلها سه مجموعه داده سری زمانی را برای 30 ، 60 و 120 دقیقه ساختند ، سپس از جنگل GLM/Random برای تولید سه مدل خطی از مجموعه داده ها استفاده کردند. برای برآورد قیمت بیت کوین ، این سه مدل به صورت خطی یکپارچه شده اند (Fauzi & Paiman ، 2020)

مجموعه داده ها

داده های این مطالعه از یک وب سایت دسترسی باز-https://www. kaggle. com/team-ai/bitcoin-price-prediction/version/1. داده های استفاده شده داده های تاریخی برای شکل گیری مدل ساده و جستجوی روندهای تاریخی است. داده ها را می توان در زمان واقعی با استفاده از مفاهیم داده های بزرگ مانند جرقه جریان و کافکا استفاده کرد. داده ها از یک پرونده واحد. csv تشکیل شده است که شامل تاریخ ، باز ، بالا ، کم ، حجم و بازار است. از بیت کویناین پرونده . csv حاوی رکورد 1556 روز از 28 آوریل 2013 تا 31 ژوئیه 2017 است.

روش شناسی

برای دستیابی به هدف کاغذ ، در مرحله اول داده های خام از API شخص ثالث یا داده ها را می توان از برخی از پایگاه های داده بزرگ مانند MongoDB یا Scrapping وب استخراج کرد. سپس بسیاری از تمیز کردن داده ها بر روی داده های خام انجام می شود و باید تجزیه و تحلیل داده های اکتشافی (EDA) را در این داده ها انجام دهد. اکنون از این داده ها برای ساختن یک مدل ، در چنین حالتی می توان از الگوریتم های متعدد استفاده کرد. یکی از آنها مدل ساده لوح است که می توان آن را به عنوان مدل خط پایه نیز نامید ، سپس برخی از مدل های شگفت انگیز مانند مدل رگرسیون خودکار وجود دارد ،

نتایج و تجزیه و تحلیل

این پروژه با استفاده از پایتون در نوت بوک Jupyter (Anaconda 3) ایجاد شده است. داده های این مطالعه از یک وب سایت دسترسی باز-https://www. kaggle. com/team-ai/bitcoin-price-prediction/version/1. داده های استفاده شده در دنیای واقعی یا داده های تاریخی واقعی برای شکل دادن به مدل ساده و جستجوی روندهای تاریخی است. داده ها را می توان در زمان واقعی با استفاده از مفاهیم داده های بزرگ مانند جرقه جریان و کافکا استفاده کرد. با استفاده از این ابزارهای بزرگ داده می توانیم داده ها را در زمان واقعی جمع آوری کنیم و آنها را تجزیه و تحلیل کنیم و این مدل را در واقعی اعمال کنیم

بحث

مدل پیشنهادی این مطالعه برای پیش بینی رمزنگاری می تواند یک مدل سازگار و مناسب باشد. مدل های قبلی مانند BTC 43 درصد نرخ را نشان می دهد. در حالی که مدل مبتنی بر رگرسیون چند خطی LTC به عنوان R2 درصد درصد 43 است. در حالی که دقت آن برای بیت کوین 57 درصد است. این مطالعه میزان رگرسیون لجستیک بیت کوین 67 را نشان می دهد در حالی که LDA 64 درصد دقت دارد. تجزیه و تحلیل تبعیض آمیز خطی مانند رگرسیون بیت کوین 67 درصد. مدل ها قبلاً مانند LTC وجود داشته اند

نتیجه

ارزهای رمزنگاری بی ثبات هستند ، روندها پویا هستند ، داده ها نه سازگار هستند و نه صاف ، در داده ها فصلی زیادی وجود دارد و روند موجود در ارزهای رمزنگاری نمی تواند کاملاً مبتنی بر داده های قبلی باشد زیرا ممکن است به صورت پویا تغییر کنند. عمدتا دو الگوریتم یادگیری ماشین برای پیش بینی مقادیر بیت کوین در این مقاله پیشنهاد و اجرا شده است. دقت چندین مدل با استفاده از معیارهای عملکرد مورد بررسی قرار گرفت ، همانطور که در شکل 27 نشان داده شده است.

بیانیه مشارکت در نویسندگی اعتباری

Rajat Kumar Rathore: مفهوم سازی ، روش شناسی ، نوشتن - پیش نویس اصلی. Deepti Mishra: مفهوم سازی ، روش شناسی ، نوشتن - پیش نویس اصلی. Pawan Singh Mehra: مفهوم سازی ، نوشتن - بررسی و ویرایش. OM PAL: مفهوم سازی ، نظارت ، مدیریت پروژه. احمد سبری هاشیم: نظارت ، اعتبار سنجی. Azrulhizam Shapi'i: درمان داده ها ، تجزیه و تحلیل رسمی. T. Ciano: نظارت ، تجزیه و تحلیل رسمی. Meshal Shutaywi: تجسم.

منابع (17)

  • A. Tealab
بازار رمزارزها...
ما را در سایت بازار رمزارزها دنبال می کنید

برچسب : نویسنده : محمود کیانوش بازدید : 25 تاريخ : سه شنبه 17 مرداد 1402 ساعت: 16:12