در این نوشته با توابع ابتدایی مربوط به آمار آشنا خواهیم شد. این توابع عبارت اند از حداقل، حداکثر، متوسط، انحراف معیار، واریانس، همبستگی متقابل، کووارینس و غیره. کتابخانه numpy در زبان برنامهنویسی پایتون این توابع را در اختیار ما قرار داده است.
در این نوشته با توابع ابتدایی مربوط به آمار آشنا خواهیم شد. این توابع عبارت اند از حداقل، حداکثر، متوسط، انحراف معیار، واریانس، همبستگی متقابل، کووارینس و غیره. کتابخانه numpy در زبان برنامهنویسی پایتون این توابع را در اختیار ما قرار داده است.
در این نوشته به معرفی دو دستور where و argwhere از کتابخانه numpy پرداخته خواهد شد. این دو دستور اگر درست و به جا استفاده شوند میتوانند موجب خوانایی کدها شده و سرعت برنامهنویسی ما را نیز افزایش دهند. با مثالها گوناگون نحوه استفاده از این دو تابع توصیف خواهد شد.
در بسیاری از وظایف بازنمایی دادهها، نیازمند نمایش اطلاعات استخراج شده توسط نمودارهای دایرهای هستیم. این نوع نمودارها که از محبوبترین و با سابقهترین روشهای بازنمایی دادهها هستند به آسانی توسط زبان برنامه نویسی پایتون و کتابخانه matplotlib قابل رسم میباشند. در این نوشته به دنبال آموزش ویرایش تو در تو نمودارهای دایرهای هستیم. در نمودارهای دایرهای معمولا ما کلاسها یا عنوانهای مختلفی داریم که هر کدام سهم مشخصی از چیزی را به خود اختصاص داده اند و این سهم مشخص گستردگی زاویه قطاع اختصاص داده شده به کلاس یا عنوان را مشخص مینماید. در نمودار دایرهای تو در تو علاوه بر کلاسها ما زیر کلاسهایی را نیز داریم که هر کدام سهمی از کلاس رده بالایی خود را دارند. با ما همراه باشید.
یکی از ابزارهای پیشبینی سریهای زمانی که اخیرا مورد توجه متخصصین داده قرار گرفته است، کتابخانه prophet فیسبوک میباشد. این کتابخانه که به زبانهای پایتون و R توسعه داده شده است، قابلیت پیشبینی سریهای زمانی غیرخطی با خاصیت فصلی بودن (seasonality) سالیانه، هفتگی و روزانه با مدل افزوده را دارا میباشد. در این نوشته در یک مثال کاملا ابتدایی اقدام به پیشبینی روند تغییرات رمز ارزها خواهیم نمود.
بسیاری از تحلیلهای عددی نیاز به تولید اعداد تصادفی دارند. تعداد زیادی از الگوریتمها نیز وجود دارند که برای ارائه راه حل اقدام به ایجاد پاسخهای تصادفی برای مسئله و بهبود آنها مینمایند. برای همین هم ایجاد اعداد تصادفی یکی از ملزومات شبیهسازیهای علمی میباشد. در این نوشته به معرفی امکانات کتابخانه numpy برای تولید اعداد تصادفی پرداخته خواهد شد.
رگرسیون خطی تخمین یک پارامتر بهصورت تابعی خطی از تعدادی داده دیگر میباشد. در عمل ما به دنبال به دست آوردن یک خط یا در حالت کلی اَبَر صفحه هستیم که با توجه به معیار خطای تعریف شده بهینه است. این روش کاربرد ویژه در علوم و مهندسی داشته و آشنایی با نحوه پیادهسازی آن در پایتون موضوع این نوشته میباشد.
یکی از پر اهمیتترین مباحث در روبرویی با بیماریهای پاندمیک پیشبینی سیر حرکتی بیماری میباشد. این کار با تحلیل و کاوش دادهها امکان پذیر میباشد. در چند ماه اخیر با شیوع بیماری کووید-۱۹ بسیاری از محققین شروع به تحلیل دادههای آماری کردهاند و بسیاری نیز در پی بازنمایی اطلاعات معنیدار استخراج شده از این دادهها هستند. در این نوشته به معرفی مخزن گیتهاب حاوی تعدادی از دادههای موارد ابتلا و نحوه خواندن این دادهها و رسم نمودار لوگاریتمی مبتلایان، بهبودیافتگان و موارد فوتی پرداخته خواهد شد.
کتابخانه محاسبات عددی numpy به همراه کتابخانههای scipy و matplotlib مجموعهای غنی از امکانات را برای انجام شبیه سازی های علمی و بازنمایی آنها فراهم آورده اند. لکن نحوه استفاده از امکانات فراهم شده توسط این کتابخانه ها تعیین کننده میزان راحتتر شدن کار برای ما می باشد. در این نوشته به بررسی ریزه کاری هایی از آرایه numpy پرداخته خواهد شد.
بستههای نرمافزاری متعددی برای انجام کارهای مربوط به یادگیری ماشین ارائه شده است که شاید از این میان نامدارترین آنها کتابخانه tensorflow باشد. با این حال برای وظایف معمولیتر و صد البته برای شروع یادگیری ماشین کتابخانههای سبکتری نیز وجود دارد. یکی از این کتابخانه که بر پایه scipy، numpy و matplotlib توسعه یافته است، کتابخانه scikit-learn میباشد. در این نوشته به نحوه تشخیص اعداد با استفاده از امکانات فراهم شده توسط این کتابخانه پرداخته خواهد شد.