Professional Documents
Culture Documents
03 - Groupby in Python - Fa
03 - Groupby in Python - Fa
کمک کند را پوشش می دهیم .تصور کنید می خواهید بدانید ،آیا رابطه ای بین انواع مختلف
و قیمت خودرو وجود دارد؟ اگر وجود دارد ،چه نوع four-wheel drive،و : forward، rearسیستم رانندگی ،شامل
سیستم رانندگی
قیمت ماشین را باالتر می برد؟ خوب می شد اگر می توانستیم همه داده ها
های drive wheelsگروه بندی کنیم و نتایج drive wheelsبا انواع مختلف
groupمختلف را با هم مقایسه کنیم .در پانداس ،این کار با استفاده از
در متغیرهای . group by methodانجام می شود methodتوسط
طبقه بندی استفاده می شود ،بر اساس طبقه بندیهای متفاوت آن متغیر ،داده ها
را به زیر مجموعه هایی گروه بندی می کند .می توانید با یک متغیر
تنها یا با متغیرهای متعدد گروه بندی کنید با وارد کردن چند نام متغیر به عنوان مثال ،بیایید بگوییم ما می خواهیم
تغییر می drive wheelsو body stylesقیمت متوسط خودرو را پیدا کنیم و ببینیم چگونه با انواع مختلف متغیرهای
کند .برای انجام این کار ،ابتدا سه ستون داده
را که می خواهیم انتخاب می کنیم ،که در خط اول کد انجام می شود .سپس داده کوچک شده را
در خط دوم body styleو drive wheelsبر اساس
گروه بندی می کنیم .از آنجاییکه می خواهیم بدانیم چگونه
قیمت متوسط درکل جدول تغییر می کند ،می توانیم میانگین
،هر گروه را محاسبه کرده و و این مقدار را به انتهای خط اضافه کنیم .داده ها به زیر گروهها
گروه بندی می شوند و تنها قیمت متوسط هر زیر گروه
و ، rear wheel drive convertiblesنشان داده می شود .می توانیم ببینیم که بر طبق داده هایمان
four wheelباالترین مقدار را دارند در حالیکه rear wheel drive hard hardtops
کمترین مقدار را دارد .این جدول ساده ترین فرم برای خواندن drive hatchbacks
این pivotنیست و همچنین تصویر سازی آن ساده نیست .برای اینکه آنرا قابل فهم تر کنیم ،می توانیم با استفاده از متد
body styleو drive wheelsتبدیل کنیم .در جدول قبلی ،هر دو pivot tableجدول را به یک
یک pivot table،در ستونها نمایش داده شدند .یک
متغیر دارد که در ستون ها نمایش داده می شود و
متغیر دیگر در ردیف ها .فقط با یک خط کد و با
body styleپانداس ،می توانیم متغیر pivotاستفاده از متد
drive wheelsکنیم تا آنرا در ستونها نشان دهید و pivotرا
را در ردیف ها .داده قیمت یک شبکه مستطیلی می شود ،که برای تصویر سازی ساده تر است .این شبیه کاریست که معموال
pivot tableدر اکسل انجام می شود .راه دیگر برای نشان دادن
شبکه مستطیلی داده ها . heat mapاست heat mapاستفاده از یک نمودار
را می گیرد ویک شدت رنگ بر اساس مقدار داده در نقاط شبکه
به آن اختصاص می دهد .این راه خوبی برای رسم متغیر
هدف با چند متغیر است و از این طریق راهنمای تصویری برای رابطه بین این متغیرها و
pyplot's p colorهدف بدست می آید .در این مثال ،از متد
را رسم کنیم و heat mapاستفاده می کنیم تا
قبلی را به یک فرم گرافیکی تبدیل کنیم .ما طرح رنگی قرمز آبی pivot table
ها شماره گذاری میشود و هرنوع xروی محور body styleرا در نظر می گیریم .در نمودار خروجی ،هر نوع از
ها .قیمت متوسط با تغییر رنگها yروی محور drive wheels
به نظر می رسد قیمت heat mapبر اساس مقادیرشان رسم می شوند .بر اساس نوار رنگ ،می بینیم که قسمت باالیی
باالتری به
.نسبت قسمت پایینی داشته باشد