هیستوگرام
آنالیزی که توسط نمودار هیستوگرام صورت میگیرد ، آنالیز اولیه و حتی کلی می باشد.در نمودار هیستوگرام نگاه کلی به فراوانی داده ها به صورت گروهبندی شده است.
اساس هیستوگرام از محور عمودی که همیشه فراوانی است و محور افقی که از داده های پیوسته (عددی) که به صورت بخش بندی تولیده شده و این بخش ها تعداد مختلف دارند که حداقل آن 20 بخش است ، می باشد.
اندازه هر میله ، فراوانی آن میله را در بین بازه ها نشان می دهد.
نمودار هیستوگرام شبیه نمودار ستونی است با این تفاوت که هیستوگرام گروهی از داده ها را به رنجی از داده ها محدود می کند و این ما هستیم که انتخاب می کنیم کدام رنج از داده ها مورد استفاده قرار گیرند.
با نگاه به نمودار هیستوگرام 4 فاکتور را می توانیم به سرعت استنتاج کنیم :
1. Pick (نقطه اوج) :به ما نشان می دهد که بیشترین فراوانی را کدام بازه به ما می دهد(شکل1).
شکل1
همانطور که می بینید نقطه اوج در نمودار فراوانی میانگین سنی مشتریان متعلق به بازه 48-52 سال می باشد که نشان میدهد 2576 نفر از مشتریان در این رنج سنی قرار دارند.
2. Gap (فاصله خالی) :گپ یعنی در بازه یا بازه هایی هیچ اطلاعاتی در دسترس نباشد و گپ ها معمولا اطلاعاتی به ما می دهند که در آنالیز اهمیت دارند (شکل2).
شکل2
3. Concentration (تمرکز) : دو یا سه میله که اندازه های مشابه دارند گوییم داده ها در آن رنج ها تمرکز دارند (شکل3).
شکل3
در تصویر می بینیم که در رنج های 59-62 و 62-66 سال مقدار فراوانی به شدت نزدیک به هم می باشد و گوییم که تمرکز در رنج 59-66 داریم.
4.Outlier (داده پرت) : بازه ها یا رنج هایی که خیلی بعید است داده ای در آنها فراوانی داشته باشد و اتفاق بیافتد (شکل4).
شکل4
نکته »اگر نمودار هیستوگرام به شکل یک مستطیلدر آید ، اشتباهاست (شکل5).
شکل5
خط هیستوگرام
نمودار خط هیستوگرام شبیه نمودار هیستوگرام می باشد. از لحاظ تصویری تفاوتی که با هیستوگرام دارد اینست که در محور افقی چند تا عدد نماینده را نشان میدهد و نه تمام رنج ها را. همچنین خطی که وسط میله های هیستوگرام را به هم وصل می کند و تبدیل به یک روند می شود از دیگر تفاوت های خط هیستوگرام با نمودار هیستوگرام است (شکل6).
شکل6
شکل 6 نمودار خط هیستوگرام را برای میزان خرید هر مشتری نشان می دهد که در بالا ، نمودار هیستوگرام آن نیز آورده شده است.
آنچه در مقاله بعد میخوانید » نمودار جعبه ای