وبلاگ vdash

اخبار و مقالات مربوط به vdash، نرم افزار آنالیز اطلاعات و ساخت داشبورد مدیریتی

مصورسازی اطلاعات کسب و کار – بخش اول: آنالیز فروش

مقدمه:

در این سری از مقالات تلاش می کنم تا راه و روش هایی را که می توان با کمک مصورسازی و آنالیز اطلاعات، و داشبوردهای مدیریتی کسب و کار رو بهتر مدیریت کرد به اشتراک بگذارم. برای این کار از داده ها و مثال های ساده ای استفاده کرده و سعی می کنم بیشتر روی نحوه مصورسازی اطلاعات تمرکز داشته باشم.

هرگونه اظهار نظر سازنده شما مورد تشکر و قدردانی قرار خواهد گرفت.

درباره ابزار:

من برای همه مثال ها از ابزار مصورسازی اطلاعات vdash استفاده می کنم. در صورت تمایل شما می توانید از طریق آدرس http://online.vdash.ir به صورت رایگان ثبت نام کنید و همه مثال ها را خودتان امتحان کنید. یا اینکه از هر ابزاری که مورد پسندتان است استفاده کنید.

درباره داده ها:

داده هایی که از آنها در مثال ها استفاده می شود، مربوط به یک کارخانه فرضی به نام AdventureWorks است که دوچرخه و لوازم جانبی آن را تولید و به 6 کشور دنیا به صورت اینترنتی و از طریق نمایندگی می فروشد. داده های فرضی ما همه انگلیسی بوده و ما بیشتر آن را ترجمه کردیم. در این مقاله از داده های فروش اینترنتی در همه مثال ها استفاده می کنیم و بقیه داده ها را در مقاله های بعدی. ریز داده های ما به شکل جدول زیر است:

adventure-works-vdash-1

البته جزئیات داده ها در هر ستون کمی پیچیده تر است. مثلا اطلاعات مربوط به مشتری یا محصول به مراتب کامل تر از نام آن است. یا موقعیت جغرافیایی شامل نام کشور و شهر و ... می شود. در سایر مثال ها از این خصوصیات برای آنالیز بهتر داده ها استفاده می کنیم.

مرحله اول: مشاهده روند فروش با کمک سری های زمانی

در اولین مثال ببینیم چگونه می توانیم با کمک سری های زمانی روند فروش محصولات خود را آنالیز کنیم. برای این کار از منوی چارت نمودار خطی را انتخاب کرده و داده های فروش اینترنتی را کلیک می کنم.

adventure-works-vdash-3

adventure-works-vdash-5

adventure-works-vdash-7

همانطور که مشاهده می کنید، سال 1386 سال پر فروشی برای ما بوده است. همچنین روند فروش ما تا سال 1386 با شیب خوبی رو به افزایش بوده ولی در سال 1387 افت شدیدی داشته و حتی از سال 1385 هم کمتر شده است. حال کمی ریزتر می شویم تا شاید دید بهتری نسبت به این افت شدید پیدا کنیم.

نمودار را فیلتر کرده تا فقط داده های سال 1386 و 1387 را نمایش دهد.

adventure-works-vdash-9

با تنظیم کردن نمودار، روند را به جای سالیانه، به صورت ماهیانه مشاهده می کنیم.

adventure-works-vdash-11

در نگاه اول متوجه می شویم که علت اصلی اختلاف فروش در سال 1387 و 1386 قطع فروش در مرداد ماه بوده است. یعنی در سال 1387 فقط 5 ماه فروش داشته ایم و مقایسه آن با 12 ماه فروش سال 1386 اشتباه است. علاوه بر آن در ماه های تیر و مرداد نیز افت قابل توجهی در میزان فروش مشاهده می کنیم. برای اینکه دقیق تر ببینیم، روی نقطه مربوط به تیر 1387 دوبار کلیک می کنیم تا به عمق داده های آن نفوذ کنیم.

adventure-works-vdash-13

اکنون دید واضح تری داریم. چون می دانیم که در تیر ماه 1387 فقط 10 روز فروش کرده ایم و بقیه روزها مبالغ ناچیزی فروخته ایم. برای مشاهده جزئیات بیشتر می توانید روی هر کدام از نقاط کلیک کنید تا ریز فروش آن روز را نمایش دهد.

adventure-works-vdash-15

حال باز می گردیم تا مقایسه اشتباه خود را اصلاح کنیم. این بار فقط 5 ماهه اول را در سال های مختلف با هم مقایسه می کنیم. برای این کار می توانیم از نمودار خطی یا میله ای استفاده نماییم. من هر دوی آنها را کنار هم قرار می دهم.

adventure-works-vdash-17

اکنون با داستان متفاوتی روبرو هستیم. نه تنها سال 1387 افت فروش نداشتیم، بلکه در مقایسه با نقطه مشابه در سال های گذشته رشد خیلی خوبی هم داشته ایم. همچنین سال 1386 که گل سرسبد فروش سالانه ما بود، در 5 ماهه اول، با سال قبل از خود تفاوت چشمگیری ندارد. این مساله احتمالا به دلیل الگوی فروش فصلی می باشد. یعنی احتمالا در ماه های آخر سال فروش بالاتر از ماه های ابتدای سال است. برای اینکه از این مساله مطمئن شویم، دو سال 1385 و 1386 را که 12 ماه فروش کامل داشته ایم با هم مقایسه می کنیم.

adventure-works-vdash-19

مقایسه سال های 1385 و 1386 به ما نشان می دهد که چرا فروش 5 ماهه اول سال در آنها تقریبا برابر بوده است. ولی از شهریور ماه به بعد، فروش در سال 1386 با رشد خوب و در سال 1385 با افت ملایمی روبرو بوده است. و این اختلاف علت اصلی قله بودن سال 1386 در نمودار اول است.

با این تفاسیر، چگونه می توان روند فروش را در طول چهار سال گذشته ارزیابی کرد؟ پاسخ ساده است. بهترین پاسخ به این سوال نمایش روند به صورت ماهانه یا فصلی در طول 4 سال گذشته است با فعال کردن گزینه روند نمودار، به وضوح رشد صعودی فروش را مشاهده خواهیم کرد. ولی هنوز افت شدید فروش در تابستان 1387 نیاز به تحقیق و عارضه یابی دارد.

adventure-works-vdash-21

نتایج آنالیز روند فروش:

  1. فروش محصولات تا اواسط سال 1385 با چالش هایی روبرو بوده و فراز نشیب داشته است
  2. از پاییز 1385 تا پایان بهار 1387 روند رو به رشد پایدار و با شیب خیلی خوب بوده است
  3. به دلایل قابل بررسی ای، فروش در تابستان 1387 به شدت افت کرده و متوقف شده است. این امر ممکن است به خاطر داده های نادرست نیز باشد.
  4. فروش سالانه ما از الگوی فروش فصلی پیروی نمی کند. بلکه به صورت پایدار با رشد مواجه بوده است.
  5. روند کلی فروش خوب و رو به رشد است و در صورت حل مشکل تابستان 1387، پیش بینی می شود این رشد ادامه یابد.

نمودارهای پایه در vdash

بعد از اینکه vdash را به پایگاه داده متصل کردیم (مقاله اتصال به پایگاه داده) و مدلسازی (مقاله مدلسازی) و طراحی مدل کسب و کار (مقاله طراحی مدل اطلاعاتی )را انجام دادیم ، می توانیم به آنالیز اطلاعاتمان در سطوح و ابعاد مختلف بپردازیم.

با وارد کردن نام کاربری و رمز عبور وارد vdash شویم (شکل 1).

شکل1

در صفحه ای که مشاهده می کنید هم می توانیم با کلیک بر روی شروع داشبورد جدید و هم از منوی داشبورد روی نوار ابزار آبی گزینه جدید (شکل 2)، به صفحه ایجاد داشبورد و رسم انواع چارت ها و گراف ها بروید.

شکل2

قبل از شروع کار بهتر است به نکاتی بپردازیم که برای یک مدیر حائز اهمیت است و توسط vdash به راحتی این نیازها برطرف می شود.

مدیران اغلب دوست دارند که بر روی اطلاعاتشان تمرکز داشته باشند. 8 گام تمرکز وجود دارد که با vdash تمامی آن ها به راحتی حصول میابد و vdash را از سایر نرم افزارهای مشابه متمایز می نماید.

  • گام نخست : نیاز های اطلاعاتی

اولین سوالی که برای یک مدیر مطرح می گردد این است که به چه اطلاعاتی نیاز دارد و چه اطلاعاتی را در اختیار دارد.

  • گام دوم : تعریف تحقیق

اینکه مدیر چه بخشی هستیم :مدیر کل هستم، مدیر فروش هستم ، مدیر بازاریابی هستم و .... با این کار می خواهیم بدانیم که تمرکزمان بر روی چه قسمتی باید باشد.

  • گام سوم : انتخاب واحد تجزیه و تحقیق

تجزیه و تحلیل داده ها در یک سازمان یا به صورت داخلی صورت می گیرد یا به صورت خارجی. تحلیل داخلی یعنی در داخل سازمان یک تیم برای آنالیز اطلاعات شکل میگیرد و تحلیل خارجی یعنی آنالیز اطلاعات را به تیم یا سازمانی در خارج از سازمان خود می سپاریم. بدیهی است که تحلیل خارجی هزینه زیادی در بر دارد.

  • گام چهارم : در دسترس بودن داده ها

استفاده از داده های موجود به شدت باعث صرفه جویی در هزینه و زمان می شود تا اینکه بخواهیم اطلاعات جدید بر اساس نیازهایمان تولید کنیم .

  • گام پنجم : ارزیابی ارزش تحقیق

تحلیل و تحقیقات باید به گونه ای باشد که بتوانیم با کیفیت بالا تصمیم گیری کنیم.

  • گام ششم: تدوین طرح

برای هر موضوعی 3 دیدگاه مطرح است : 1-دیدگاه من 2- دیدگاه شما 3- دیدگاه واقعیت تدوین طرح شامل انتخاب ابزار درست می باشد.

  • گام هفتم : تجزیه و تحلیل

براساس اطلاعاتی که داریم و با استفاده از ابزار مناسب به تحلیل داده ها می پردازیم.

  • گام هشتم: ارائه یافته های

با توجه به نتیجه تحلیل و بررسی داده ها تصمیماتی مناسب و کارآمد در ازتباط با کسب و کارمان اتخاذ می نماییم.

حالا به کمک vdash به تحلیل اطلاعات می پردازیم.

طریقه دسترسی به انواع چارت ها و گراف ها از نوار آبی بالای صفحه می باشد.

هدف ما در vdash به تصویر کشیدن اطلاعات خام است.در این مقاله می خواهیم نحوه نمایش اطلاعات را بررسی کنیم که در چه موقعیت هایی از چه شیوه ای ، اطلاعاتمان را به نمایش بگذاریم تا تحلیل بهتر و دقیق تر و از همه مهمتر آسان تر داشته باشیم. در اینجا به توضیح نمودار های زیر می پردازیم :

ماتریس تک محوری

برای نمایش اطلاعاتی که به صورت اعداد و ارقام هستند، می توانیم از ماتریس تک محوری استفاده نماییم.این ماتریس اطلاعات را بر اساس یکی از ابعاد مربوطه دسته بندی می نماید و آمار مربوط به آن را به نمایش می گذارد.

ماتری دو محوری

همانند ماتریس تک محوری است با این تفاوت که اطلاعات را در دو گروه و در قالب سطرها و ستون ها تقسیم می کند.

برای اینکه قسمت نمودار ها برایتان ملموس تر باشد میتوانید ویدیوی زیر مشاهده فرمایید.

نمودار میله ای عمودی و افقی

نمودار میله ای عمودی و افقی مشابه هم هستند و فقط از لحاظ نمایشی و نگاه شما تفاوت دارند.حال می خواهیم بدانیم که در چه مواقعی و برای چه داده هایی از نمودار میله ای استفاده می نماییم.

نمودار میله ای از یک سری میله هایی تشکیل شده که پایه میله ها (محور افقی) گروه ها یا داده های قابل دسته بندی قرار می گیرند پس بیشتر داده هایی که در محور افقی قرار می گیرند از نوع عددی نخواهند بود. مثلا سن از نوع داده عددی است ولی رنج سنی از نوع داده های گروه بندی می باشد (کودکان-نوجوانان-جوانان-میانسالان-کهنسالان) و حتی حقوق اگر به صورت کم-متوسط و زیاد دسته بندی گردد از نوع داده گروهبندی خواهد بود.

در محور عمودی نمودار ، داده عددی قرار دارد. در این نمودار یک سری داده های عددی در مقابل داده های اسمی یا گروه بندی قرار می گیرد. در نتیجه با یک نمودار میله ای می توان. تصمیم گیری کرد. نمودار زیر را در نظر بگیرید(شکل3).

شکل3

در این نمودار تعداد دانشجویان بر اساس دانشگاه –گروه به تصویر کشیده شده است، که محور افقی دانشکده های دانشگاه را نشان می دهد در واقع یک دانشگاه به گروه های علوم انسانی،فنی مهندسی،هنر و علوم پایه تقسیم بندی شده است و محور عمودی تعداد دانشجویان (داده عددی) را نشان می دهد. نتیجه ای که از این نمودار می توانیم بگیریم، این است که تعداد دانشجویان در دانشکده علوم انسانی از همه بیشتر و با اختلاف چشم گیری به ترتیب دانشکده فنی و مهندسی ،هنر و علوم پایه تعداد دانشجو دارند. در نمودار میله ای داده هایی که به صورت تعداد و شمارشی هستند، بیشتر کاربرد دارد که همانطور که گفتیم در محور عمودی قرار میگیرند و بهتر است که داده های گسسته باشند.

حال اگر بخواهیم معدل کل در مقاطع تحصیلی متفاوت را بررسی نماییم کافی است به پنل تنظیمات رفته و دسته بندی را به مقطع تحصیلی (شکل4) تغییر داده و از فیلدهای محاسباتی معدل کل را انتخاب می نماییم(شکل5).

شکل4

شکل5

در اصل فیلدهای محاسباتی در پنل تنظیمات محور عمودی را نشان می دهند.

هر نموداری را می توانیم بر اساس هر فیلدی که می خواهیم ، مرتب کنیم و در مرتب سازی جای میله ها تغییر میکند و در واقع ترتیب محور افقی عوض می شود. و می تواند صعودی یا نزولی باشد.(شکل 6).

شکل6

در نمودار میله ای می توانیم محور افقی را زمان در نظر بگیریم و با این کار روند تغییرات کلی ای از فیلد محاسباتی را ببینیم و تصمیم گیری کنیم.

توجه : بهتر است بیش از دو دسته بندی در نمودار میله ای نداشته باشیم.

نمودار خطی

نمودار خطی جز آن دسته از نمودارهایی است که دو مقایس اندازه گیری را شامل می شوند، یکی از مقیاس ها در امتداد قائم و مقیاس دیگر در امتداد افق قرار می گیرد و چون نمودار خطی توالی را نشان می دهد ، اصل و ماهیت آن اینست که در محور افقی واحد زمان قرار گیرد و در محور عمودی بهتر است که داده های دسته بندی قرار نگیرند.

نمودار خطی زیر که برای فروش اینترنتی یک واحد تولیدی می باشد را در نظر بگیرید(شکل7):

شکل7

با یک نگاه اجمالی به این نمودار متوجه می شویم که بین سالهای 1384-1387 میزان فروش به چه صورتی بوده است و بیشترین فروش متعلق به سال 1386 می باشد و همچنین روند تغییرات را می توانیم ملاحظه کنیم که در سالهای 1384 تا 1386 افزایش فروش داشته ایم و از 1386 تا 1387 روند کاهشی بوده است.

همانطور که اشاره کردیم یکی از نکات مهمی که از نمودار خطی برداشت می کنیم "خط روند" است. نحوه تغییرات را روند گویند و خط روند خطی است که به ما نشان می دهد این تغییرات به صورت افزایشی بوده اند یا کاهشی و بیشتر برای مقایسه به کار می رود. و این روند زمانی که دو یا چند نمودار همزمان بررسی می شوند خیلی کار تحلیل را برای ما آسان میکند و با انتخاب سری می توانیم بیش از یک مورد را بررسی کنیم.مثلا در (شکل 8) میزان فروش در سال های 1384 تا 1387 برای افراد مجرد و متاهل بررسی میگردد و بعلاوه اینکه روند این دو را می توانیم مشاهده کنیم که هر دو روند افزایشی و نزدیک به هم دارند و با اختلاف اندک میزان فروش مشتریان متاهل بیشتر بوده است.

شکل8

نکته : قبلا گفتیم که در محور افقی نمودار خطی واحد زمان قرار میگیرد، مورد استثنایی داریم که می توانیم در محور افقی از داده های دسته بندی استفاده کنیم و محور عمودی را فقط و فقط فراوانی داده ها قرار دهیم که در این حالت نمودار خطی به نمودار چند وجهی فراوانی تبدیل می شود(شکل 9).

شکل9

نمودار سطحی

نمودار سطحی شبیه نمودار خطی است و فقط در این نمودار مساحت زیر نمودار مشخص می شود.

شکل10

از شکل 10 درمی یابیم که میزان فروش از مالیات بیشتر بوده زیرا سطح زیر نمودار میزان فروش بیشتر است.

نمودار دایره ای و حلقه ای

در نمودار دایره ای داده ها در قطاع ها و قسمت های یک دایره تقسیم می شوند که زاویه و مساحت هر قطاع بزرگی آن بخش را نشان می دهد.

از نمودار دایره ای برای نمایش ابعاد نسبی از کل استفاده می شود.

شکل11

در نمودار بالا میزان فروش در کشورهای مختلف نمایش داده شد و همانطور که می بینیم رنگ سبز بیشترین مساحت را دارد که متعلق به ایالات متحده می باشد.

آنچه که در مقاله بعد مطالعه می کنید » نمودار قیفی و رادار


نحوه اتصال vdash به پایگاه داده

در مقاله گذشته("نحوه مدلسازی vdash") با ایجاد مدل به طور کامل آشنا شدیم و در اینجا نحوه اتصال vdash پایگاه داده را با هم بررسی می کنیم.

هر مدل را می توانیم به یک یا چندین پایگاه داده متصل کنیم. برای این کار+New Data Source را انتخاب می کنیم (شکل 1).

ایجاد پایگاه داده

شکل 1

نام پایگاه داده را در قسمت Data Source Name وارد کرده(شکل 2)در اینجا برای مثال نام پایگاه داده را AdventureWorksDWPersian گذاشتیم که مربوط به اطلاعات یک واحد تولیدی می باشد.

پایگاه داده

شکل 2

سپس نوع پایگاه داده را مشخص میکنیم یعنی اطلاعات ما در چه قالبی قرار دارند یا با کدام پایگاه داده طراحی شده اند، که می تواند

پایگاه داده ای است که به My SQL متصل می گردد My SQL Data Provider :
پپایگاه داده ای که به OLAP متصل می گردد. Microsoft SSAS(OLAP):
پایگاه داده ای که به فایل هایی با فرمت اکسل و یا اکسس وصل می شود. OLDBE(Excel,Access):
پپایگاه داده ای که به Oracle طراحی شده و به vdash متصل می گردد. Oracle Data Provider:
: برای اتصال به پایگاه داده های PostgreSQL PostgreSQL:
پایگاه داده ای که به SQL Server متصل می گردد. Microsoft SQL Server:

باشند(شکل 3).

انتخاب دیتاسورس

شکل 3

در مقالات آتی تک تک این موارد بررسی میگردد. در مثال واحد تولیدی نوع Data Source ، Microsoft SQL Serverمی باشد.

حال باید در کادر مربوط به Connection Stringدستور اتصال AdventureWorksDWPersianبه vdashرا بنویسیم.

data source = localhost ; initial catalog = AdventureWorksDWPersian ; integrated security = true ;

(شکل 4) .کوچکترین اشتباهی در نوستن دستور اتصال شما را با خطا مواجه میکند.برای اطمینان و تست اینکه آیا پایگاه داده ما به vdash متصل شده است یا نه از Test Connection استفاده می کنیم و هنگامی که عملیات با موفقیت انجام شده با شد با پیغام "برقراری ارتباط با موفقیت انجام شد" مواجه می شویم. اگر در قسمت connection string اطلاعات بیشتری نیاز دارید به http://connectionstrings.com/ مراجعه فرمایید.

چک کردن اتصال

شکل 4

 آنچه در مقاله بعد می خوانید » تعریف و ایجاد بعد در vdash

نحوه مدل سازی اطلاعات در vdash

برای اینکه بتوانیم داده هایمان را در vdash به تصویر بکشیم و آنها را آنالیز نماییم، ابتدا می بایست آنها را مدل سازی نماییم. مدل سازی یعنی اینکه ساختار خشن و غیر قابل درک پایگاه داده را به شکل مدلی ساده و قابل فهم برای مدیران اجرایی و غیر فنی تبدیل کنیم. در واقع مدل سازی ترجمه ساختار پایگاه داده است به زبان آنالیز. این مدل از اجزای زیر تشکیل شده است که ما همه آنها را به تفکیک شرح خواهیم داد:

  • دادگان یا data set
  • بعد یا dimension
  • مدل اطلاعاتی

در واقع یک مدل اطلاعاتی مجموعه ای از چند بعد و دادگان مرتبط تشکیل شده است. برای ایجاد یک مدل، مراحل زیر را طی می کنیم:

  1. ساخت یک مدل خالی جدید
  2. اتصال مدل به پایگاه های داده مورد نظر
  3. ایجاد دادگان ها
  4. ایجاد بعد های مورد نظر
  5. اتصال بعدها به دادگان ها
  6. تعریف متریک ها یا فیلدهای محاسباتی و شاخص های کلیدی عملکرد

برای دسترسی به ساخت مدل، از منوی تنظیمات به کنترل پنل می رویم(شکل 1) و روی آیکن مدل ها کلیک می کنیم (شکل 2).

کنترل پنل

شکل 1

شکل 2

مرحله اول » ایجاد مدل خالی جدید

در صفحه مدل های اطلاعاتی روی گزینه ایجاد مدل جدید کلیک کنید تا یک مدل خالی جدید برای شما ایجاد شود. (شکل 3) مدل ها

شکل 3

در صفحه اصلی فیلدهای مربوطه را به این صورت پر کنید(شکل4):

Template Name: نام سیستمی مدل باید حتما انگلیسی و بدون فاصله باشد

Display Name: نام نمایشی ��ه کاربر آن را می بیند

Description (Optional): توضیحات مربوطه به صورت اختیاری

انتخاب مدل

شکل 4

مرحله دوم » اتصال مدل به پایگاه های داده

در اینجا برای سادگی کار، ما مدل را به یک پایگاه داده فرضی با نام AdventureWorks مربوط به یک واحد تولیدی دوچرخه و لوازم جانبی آن متصل می کنیم. برای آشنایی بیشتر با این پایگاه داده به آدرس زیر مراجعه کنید:

http://msftdbprodsamples.codeplex.com/

روی لینک + New کنار پنل Data Sources کلیک کنید تا یک منبع اطلاعاتی جدید به مدل اضافه شود. مشخصات منبع اطلاعاتی را به این شکل تکمیل نمایید:

Data Source Name: نام سیستمی منبع داده به انگلیسی “AdventureWorks”

Data Source Type: نوع پایگاه داده ای که می خواهیم به آن وصل شویم “SQL Server”

Connection String: دستور اتصال به پایگاه داده

“Data Source = localhost ; Initial Catalog = AdventureWorksDWPersian; Integrated Security = true“

برای اطمینان از برقراری ارتباط Test Connection استفاده می کنیم(شکل 5).

ایجاد مدل جدید

شکل 5

مرحله سوم » ایجاد دادگان ها

دادگان یا موجودیت اطلاعاتی مجموعه ای از فیلدهای مورد نیاز از پایگاه داده است.

برای مثال در اینجا دادگان مربوط به فروش اینترنتی را ایجاد می کنیم. در این دادگان موارد محصول، تاریخ سفارش، منطقه جغرافیایی، قیمت واحد و تعداد مد نظر ما است، دستور ایجاد آن به شکل زیر خواهد بود:

“SELECT ProductKey, OrderDateKey, SalesTerritoryKey, OrderQuantity, UnitPrice FROM dbo.FactInternetSales”

برای ایجاد دادگان مورد نظر، روی لینک + New کنار پنل Data Sets کلیک کرده و نام سیستمی و نام نمایشی دادگان را وارد نمایید. (شکل 6)

اتثال به پایگاه داده

شکل 6

سپس روی سربرگ Query کلیک کنید تا بتوانید دستور مورد نظر را وارد کنید. قبل از اجرای دستور، نوع منبع اطلاعاتی یا Source Name که در مرحله قبل ساخته اید را انتخاب نمایید. (شکل 7)

ایجاد دادگان

شکل 7

روی دکمه Execute Query کلیک کنید تا دستور شما اجرا و فیلدهای دادگان اضافه شوند. در سربرگ فیلدها، عنوان فارسی هر فیلد را در ستون Display Name وارد نمایید. (شکل 8)

کوئری

شکل 8

مرحله چهارم » ایجاد بعدها

بعدها یا Dimensions آیتم هایی هستند که برای مقایسه کردن یا فیلتر کردن اطلاعات به کار می روند. برای مثال وقتی میزان فروش را در ماه های مختلف سال مقایسه می کنیم، در واقع بعد زمان برای ما کاربرد دارد. یا وقتی فروش محصولات مختلف را در سال گذشته بررسی می کنیم، بعد زمان و محصول هر دو تاثیر گذارند. با توجه به دادگان هایی که در مدل تعریف می شوند، بعدهای مختلفی مورد نیاز خواهد بود.

برای تعریف بعد روی لینک + New کنار پنل Dimensions کلیک کرده، نام سیستمی و نام نمایشی بعد را وارد نمایید. (شکل 9)

فیلدها

شکل 9

در سربرگ Query مانند کاری که در دادگان انجام دادید، عمل کرده و دستور فراخوانی بعد مورد نظر را بنویسید. در اینجا برای مثال ما بعد زمان را از جدول dimdatepersian فراخوانی می کنیم:

“SELECT datekey, alternatedate, persiandate, dayofweeknumber, dayofweekname, dayofmonthnumber, monthofyear, monthofyearname, monthkey, monthname, quarterofyearnumber, quarterofyearname, quartername, quarterkey,year FROM dbo.DimDatePersian”

ایجاد بعد

شکل 10

با کلیک کردن روی دکمه Execute Query و پیش نمایش داده های بعد، خصوصیات یا Attribute های بعد اضافه خواهند شد. خصوصیات بعد، تقریبا متناظر با فیلدهای دادگان بوده و توضیحات بیشتر در مقاله های تخصصی آنها داده خواهد شد.

کوئری بعد

شکل 11

در سربرگ Advanced لطفا مراحل زیر را انجام دهید. توضیحات مربوطه در مقاله مربوط به تعریف بعدها ارائه خواهد شد.

Key Attribute: روز

Hierarchy: از بالا به پایین  سال / فصل / ماه / روز

مرحله پنجم » اتصال بعدها به دادگان ها

مجددا به دادگان فروش اینترنتی رفته و در سربرگ مربوط به Dimensions، بعدی را که ایجاد کردیم، می افزاییم (شکل 12).

انتخاب بعد

شکل 12

مرحله ششم » تعریف متریک ها و شاخص ها

بعد از تکمیل مرحله مدلسازی مدل را ذخیره کرده و روی گزینه Business Design در نوار ابزار بالای صفحه کلیک کنید. شما به فضای جدید منتقل می شوید که در آنجا به طراحی غیر فنی مدل اطلاعاتی می پردازیم. در این قسمت معیارها و خواسته های سازمان پیاده سازی می شود. در واقع در این قسمت فیلدهایی که قرار به محاسبه آنها هست و همچنین تعریف شاخص ها صورت می گیرد. برای مثال اگر بخواهیم برای فروش اینترنتی میزان فروش و یا درصد سود را محاسبه کنیم باید در قسمت مربوط به فیلدهای محاسباتی این دو را با ذکر فرمول و نحوه محاسبه تعریف نماییم(شکل 13).

فیلد مخاسباتی

شکل 13

اکنون مدل ما آماده رسم انواع گراف ها و چارت های متنوع است. مدل را ذخیره کرده و به صفحه اصلی برگردید. داشبورد جدید را کلیک کنید و از منوی نمودار، گزینه نمودار میله ای عمودی را انتخاب نمایید. با انتخاب دادگان فروش اینترنتی، نمودار برای شما رسم خواهد شد. (شکل 14)

رسم نمودار

شکل 14

در مقاله بعدی با نحوه اتصال vdashبه پایگاه داده آشنا خواهید شد.

گام های رسیدن به یک فرهنگ سازمانی داده محور




سازمان های داده محور چندین خصوصیت مشترک دارند:


  • ذهنیت داده محور و معیارهای پشتیبانی زیرساخت

 شرکتهای داده محور فرآیندهایی تعریف می کنند که از شاخص های کلیدی عملکرد اساسی سازمان و کسب و کار خود پشتیبانی می کنند ، و به کارکنان خود اعلام می کنند که بر اساس این معیارها فعالیت کنند . به گزارش آبردین هفتاد درصد از این سازمان ها یک مدیر ارشد متخصص تجزیه و تحلیل دارند. به گزارش Econsultancy به نام  "فرهنگ داده محور " که در آن بیش از 300 startup در حوزه IT و سایر صنایع ،عمدتا واقع در شمال امریکا و غرب اروپا ، را مورد بررسی قرار داده است اعلام می کند  که بیش از 70 درصد از startup  های فعال حداقل یک کارمند را برای جمع آوری داده و تجزیه تحلیل آن اختصاص داده اند . 


  • داده ها متمرکز و سازمان یافته هستند

 برای اطمینان از اینکه داده ها جدید و مرتبط هستند ، فرهنگ داده محور اطلاعات را از سراسر سازمان  جمع آوری و سازماندهی می کند. داده متمرکزامکان  به روز رسانی مداوم، و نگه داشتن داده در حالت تازه و به روز در کل ابعاد کسب و کار را ایجاد می کند . شرکت ها باید نسبت به آنچه جمع آوری می کنند و حجم داده ها توجه داشته باشند . با توجه به Econsultancy، اطلاعات اضافه یک تهدید واقعی است.برای اینکه مطمئن باشید که اطلاعات درستی را بررسی می کنید احتیاج به ساده سازی و تمرکز دارید .


  • خطی مشی حاکم برای دسترسی به داده ها

 در سازمان های داده محور، سیاست رسمی دسترسی کاربرها را کنترل می کند. آنها  زنجیره ای قابل ردیابی را ایجاد می کنند تا ریسک را کاهش دهند، سطوح دسترسی را تعیین می کنند و کاملا مشخص می کنند که چه کسانی چه اطلاعاتی را می توانند تغییر دهند . به گفته آبردین سازمان های داده محور 56 درصد بیشتر از سایر سازمان ها دارای سیاست های رسمی کنترل داده هستند. 


  • دسترسی به داده ها لایه لایه است

 سازمان های داده محور یک راهکار پیچیده لایه لایه برای مدیریت شاخص های کلیدی دارند که در آن هر متریک به وضوح به عملکرد سازمانی و نتیجه مورد نظر مرتبط است. این معیارها به خوبی تعریف شده، و به صورت شفاف با نیروی کار ارتباط برقرار می کنند و البته به صورت منظم اندازه گیری می شوند .


  • ابزارهای تجزیه تحلیل یکپارچه هستند 

 ابزار تحلیلی مورد استفاده در سازمان های داده محور جزو نوآورانه ترین ابزارهای موجود و در دسترس می باشد.این ابزارها که اغلب بینشی هستند و داده ها را مصور سازی می کنند معمولا جزو پرکاربردترین نرم افزارهای موجود در سازمان به شمار می آیند .ابزارهای موجود در لایه های امنیتی شرکت های بزرگ قرار می گیرند و از طریق ابر اطلاعاتی و دستگاه های تلفن همراه برای حمایت از انواع فعالیت های سازمانی و کارکنان قابل دسترس می باشند. 


اما اگر داده در کل سازمان قابل دسترس نباشد و همه نتوانند با آن ارتباط داشته باشند بی ارزش خواهد بود . Econsultancy اشاره می کند که در سازمان ها از هر اندازه ای که باشند، بهترین وسیله ارتباطی داده داشبوردها و بعد از آن گزارش ها هستند . 

با ارزش نهادن به داده به اندازه حس های مدیریتی و حدس ها ، سازمان های داده محور می توانند از فضای تحلیلی خود برای تولید اطلاعات تاکتیکی و مرتبط در زمان و مکانی که به آن احتیاج دارند استفاده کنند . 



پل بین خود و داده ها و اطلاعات ارزشمندتان را بسازید !


سرعت رشد داده ها به صورت مبهوت کننده ای زیاد است . بین فعالیت ما ، وسایل الکترونیکی مان و وبسایتمان ، داده ها با سرعت زیادی در حال رشد هستند وهمواره در حال ذخیره کردن آنها هستیم . این توانایی، دارایی ارزشمندیست ،که به ما امکان خلق فرصت های جدید و هیجان انگیز و دنبال کردن تمام موارد مربوط به فعالیت هایمان از بهره بری و مشتریان بالقوه گرفته تا بودجه ، سود و کیفیت خدمات به مشتریان و... – می بخشد . 

ولی حتی امروز با وجود این انفجار اطلاعات ما هنوز به صفحه گسترده های اکسل خود متکی هستیم و فکر میکنیم این روش در حال اتصال ما به تمام داده های ارزشمندمان است . ولی نه تنها این روش چیزی به غیر از اتلاف وقت نیست بلکه گستره ای از اطلاعات پیچیده را به ما به صورت پیچیده تری نشان میدهد که تفسیر و تحلیل آنها و توضیح آن در یک جلسه کاری، نزدیک به غیر ممکن است . 

بیاییم با هم صادق باشیم ، هیچ چیز بدتر از یک صفحه گسترده با سطرها و ستون های پر از عدد در یک جلسه کاری نیست ! داده ها نباید کسل کننده شوند . داده یک ابزار برای بهبود فرآیند کمپانی شماست پس باید به شکلی ارائه شود که این قدرت را داشته باشد و به گروه و یا فرد تصمیم گیرنده سازمان شما جهت دهد . 

عصر مصورسازی اطلاعات :

مصورسازی اطلاعات پلی است که روی فضای خالی میان داده های شما و بهره وری و بهبود فرآیند و وضعیت سازمان شما قرار می گیرد . مصورسازی اطلاعات به سازمان یک انتخاب قابل دسترس و تحریک کننده برای آنالیز و سپس بهبود می بخشد . 

این یک واقعیت است که تعداد کمی از افراد با اعداد خام ارتباط برقرار می کنند . بیشتر ما با نقشه ای که ما را از نقطه یک به نقطه دو میرساند ، عکس ، گراف های رنگی و گیج ها ارتباط بهتری برقرار می کنیم . اما تبدیل کردن اعداد  به نمودارها ، گیج ها ، نقشه ،جداول  و ساختن این پل، کاری زمان بر با ظرافت ها و دارای پیچیدگی های خاص خود است ، که هر اشتباه کوچکی در آن منجر به تصمیم های نادرست و فجایع سازمانی می شود .

 حقیقتا اکثر افراد از این واقعیات آگاهند ولی ابزار مناسب، دقیق، یکپارچه و ساده ای که برایشان این پل را می سازد  نمی شناسند و یا نمی یابند. اگر جزو این اکثریت هستید چه خواهید کرد اگر بگوییم امکان مشاهده ساخت این پل و مصورسازی اطلاعات ارزشمندتان را به صورت زنده برای شما فراهم آورده ایم ؟

دموی آنلاین vdash

اشتباهات بزرگ در زمینه مصورسازی اطلاعات در فرآیند هوش تجاری در 20 سال گذشته

گرفتن گزارش بر اساس اطلاعات گذشته یک سازمان بخشی از فرآیند هوش تجاری می باشد . انتخاب یک سیستم گزارش گیری با توجه به نیازهای کاربران باید در طراحی فرآیند هوش تجاری سازمان مورد توجه قرار گیرد . پس شاید یک کاربر و در حالت کلی یک سازمان نیاز به طراحی یک فرآیند هوش تجاری مناسب داشته باشد که قسمتی از آن فرآیند گزارش گیری تعریف شود و سیستم مناسب گزارش گیری آنجا جای گیرد و خدمات خود را به کاربر ارائه دهد تا او بتواند تصمیمات دقیق اطلاعات محور اخذ کند و یا اطلاعات کامل تری به مدیران ارشد خود گزارش دهد.

مصورسازی اطلاعات

ولی آیا گزارش هایی که در سطرها و ستون های یک فایل اکسل قرار گرفته است کارآمد است ؟

داده ها برای به سخن درآمدن باید از سطر ها و ستون های داده خام خارج شده و به فرمت مصور دربیایند . باید منابع فرآیند هوش تجاری سازمان خود را گردآوری کرده و آن را وارد فرآیند مصورسازی اطلاعات کنید . گزارشگیری مصور با رنگ ها ، خطوط روند ، کشیدن چارت ها ، نشان دادن سری های زمانی و حتی نقاط پرت به نظارت ، تصمیم گیری ، کاهش هزینه و انرژی، بررسی شاخص های عملکرد سازمان بسیار کمک می کند . نرم افزارهای مصورسازی اطلاعات و داشبوردهای مدیریتی که امکان تعامل با کاربر را دارند دارای کاربری بیشتری و در این زمینه ارزشمندتر می باشند . 

کلمه بازار تداعی کننده شلوغی و هیاهو و صدای فریاد فروشندگانی است که قصد جلب نظر شما را دارند . امروزه در بازار شلوغ ابزار های داده پردازی و مصورسازی داده یک صدا به صورت مشخص و غالب به گوش می رسد : " همه امروزه توانایی تحلیل داده را دارند " ، این جمله شاید برای خیلی ها یادآور خرید های ناموفق ابزارهای   مصورسازی اطلاعات هوش تجاری در گذشته باشد . بسیاری از مدیران و کارشناسان تاکنون حداقل یک بار در مورد این ابزار ها تحقیق کرده اند ، و بعضی نیز در جلسه معرفی آنها شرکت کرده اند.

اگر شما یکی از این افراد هستید می دانید که با نگاه کردن به افراد حاضر در جلسه که مثل شما به دنبال راهکار جالب و کارآمدی برای بهبود کسب و کار و پیشرفت می گردند ، با گوش دادن به حرف هایشان مشخصا می توانید بگویید که حداقل 2 نفر از هر 10 نفر قطعا از این ابزار استفاده نخواهند کرد به دلیل آنکه یا نمی توانند موضوعیت استفاده از نرم افزار را با کار خود تطبیق دهند یا نمی خواهند از ابزاری استفاده کنند که ساعت ها نیاز به آموزش داشته باشد .6 نفر ازجلسه راضی به نظر می رسند و فکر می کنید که به ابزار علاقه مند شده و قصد خرید آن را دارند . ولی بعدها متوجه می شوید که هیچکدام از آنها نیز از ابزار استفاده نکرده اند  چون هنگام بازگشت به کار آنقدر درگیر مشغولیت های روزمره خود بوده اند که زمانی جلسه را به خاطر می آورند نحوه کار با نرم افزار را فراموش کرده اند . 2 نفر باقیمانده نیز به دلیل آنکه نرم افزار شباهت زیادی به اکسل دارد به آن علاقه مند می شوند و کار با آن را شروع می کنند . تولید کنندگان  این نرم افزارها اندک و مصرف کنندگان طیف عظیمی از صنایع و تخصص ها را در بر می گیرند .

داده های بزرگ

در طی سال ها تجربه نشان داده است که یک سناریو در سازمان ها ، صنایع و با سیستم های متفاوت تکرار می شود : 
سازمان یک سیستم گزارشگیری تخصصی تهیه می کند که مدل مشتری / تولید کننده را پشتیبانی می کند ولی کاربر نهایی سیستم مثلا مدیر از عدم انعطاف سیستم بعد از مدت کوتاهی شکایت میکند . سیستم به قدری یک بعدی است که مدیر بدون کمک گرفتن از بخش فناوری اطلاعات سازمان یا تماس با تولید کننده  قادر به پاسخگویی سوالات سطح دو و سه خودش در مورد داده ها نیست . همچنین حتی اگر پاسخگویی به نیاز از طریق کارشناسان مربوطه انجام پذیرد ، آنقدر زمان بر خواهد بود که مدیر از دسترسی نداشتن به اطلاعات در زمان مناسب برای اخذ تصمیم درست برای سازمان شکایت خواهد داشت . 

برای حل این مسئله چاره ای دیگری اندیشه می شود ، سیستم دیگری جایگزین می شود با این قول که کاربر امکان دسترسی به تمام داده های خود را در هر زمانی خواهد داشت . ولی فقط زمانی که برای استفاده از این سیستم آموزش دیده باشد . یادگیری یک سیستم جدید برای کاربر در موقعیت تصمیم گیری معمولا دشوار و زمان گیر است . پس او گروهی را استخدام کرده تا برایش گزارش تهیه کرده و ارائه دهند . بعد از مدت کوتاهی این گروه کوچک به دلیل حجم زیاد گزارشات دچار تاخیر در سرویس دهی به مدیر خود می شوند و چرخه تکرار می شود .

آنالیز اطلاعات

همه ی این موارد از یک سوء تفاهم منشا می گیرد که فروشندگان و تولیدکنندگان نتوانستند تشخیص دهند که سه نوع مصرف کننده سیستم گزارش گیری وجود دارند : دسته ای که  آنالیز می کنند و دسته دوم که نظارت می کنند و دسته سوم که هر دو این کارها را انجام می دهند   . 
درنتیجه  نوسانی که بین این راهکار ها و رویکردها به وجود آمده است منجر به کمبود اطلاعات برای کسانی شده است که در موقعیت و زمان تصمیم گیری هستند . تفاوت بین تصمیم خوب و بد کیفیت داده هایی است که برای گرفتن آن تصمیم مورد استفاده قرار می گیرد . تصمیم هایی اشتباه بر اساس داده های قدیمی و ناقص گرفته می شوند به دلیل آنکه امکان دسترسی به داده ها و یا گسترش آنها در زمان مورد نظر وجود ندارد . 


داده کاوی

برای انجام فرآیند گزارش گیری  و مصورسازی اطلاعات که قسمتی از فرآیند هوش تجاری است بهتر است از سیستمی با خصوصیات زیر استفاده کنیم :
سیستمی که بدون احتیاج به کارشناسان فناوری اطلاعات بتواند به نیازهای کاربرش پاسخ دهد . 
سیستمی ساده که احتیاج به آموزش نداشته باشد . 
سیستمی که قابلیت صحبت به زبان هر صنعتی را داشته باشد . 
سیستمی که با کاربر تعامل کامل داشته باشد . 

سیستم گزارش گیری مثل یک برنامه موبایل است :

                                                        

تا امروز وضعیت سهام و یا ترافیک  را روی اپلیکیشن موبایل خود بررسی کرده اید ؟ 
کمی فکر کنید ؛ تا امروز چند بار برای یادگیری کار با یک برنامه که روی موبایلتان نصب شده کلاس رفته اید ؟
چند بار برای آموزش برنامه موبایل دفترچه راهنما مطالعه کرده اید ؟
وضعیت آب و هوا را روی موبایل خود چک میکنید ، قیمت ارز و سهام را بررسی می کنید و بسیاری از کارهایی که نرم افزار ها برای شما انجام داده و کار شما را ساده کرده اند . 
چرا برای استفاده از یک سیستم گزارش گیری شما باید آموزش ببینید ؟  

طراحان ابزارها پاسخ می دهند : "کاربران نمی دانند چه اطلاعاتی مد نظرشان است"
این پاسخی است که در جواب آن سوال همیشه دریافت می کنم ! اشتباه استسیستم باید به حدی ساده باشد که شما برای کار با آن نیاز به صرف زمان و تمرین نداشته باشید . 

به سیستم اطلاعات بیماران نگاه کنید . این سیستم ها به دقت با نیاز پزشکان تطبیق داده شده اند . پزشک نام بیمارش را جستجو می کند و تمام اطلاعات مربوط به او مثل جواب آزمایشات قبلی ، عکس های رادیوگرافی و... را مشاهده می کند . کدام کاربر سیستم اطلاعاتی قرار است کاری پیچیده تر از کار یک پزشک انجام دهد ؟ اگر برای پزشکان می شود سیستمی طراحی کرد که به نیازهایشان پاسخ دهد برای باقی افراد نیز می توان این کار را با پبچیدگی های خاص خود انجام داد . 
مسئله این است که نمی توانیم نیاز کاربران را آشکار کنیم . دغدغه های یک فرد در موقعیت تصمیم گیری برای کسب و کار و سازمان خود بسیار زیاد و حساس هستند . که متاسفانه اولویت کاربر و نیاز او که دقت ،سرعت و سادگی است تا امروز برای اکثر طراحان سیستم ها و نرم افزار های گزارش گیری و مصورسازی داده ها اهمیتی نداشته است.
امروز ما به این نکته دست یافتیم که در کنار شناخت دغدغه ها ، ایجاد دید نظارتی و پاسخ به نیازهای کاربران که اغلب مدیران ، کارشناسان فروش ، مهندسان ، مشاوران و... هستند و دارای تفکرات خاص خود در چارچوب اصطلاحات و فرآیندهای تعریف شده کسب و کار خود می باشند .باید امکانی را برای آنالیز داده  به صورت مصور فراهم کنیم که این افراد و دیگر بخش های سازمان  در مواجهه با موارد خاص و ویژه ، آنها را بررسی کرده و به پرسش های خود پاسخ دهند . 

آنالیز اطلاعات با داشبورد مدیریتی

» چنانچه با خواندن این مقاله به موضوع هوش تجاری علاقه مند شدید، خواندن مطالب زیر را به شما پیشنهاد می کنیم:
هوش تجاری داده کاوی
چرا شرکت ها به هوش تجاری نیاز دارند داده ها با شما حرف می زنند !

داده ها با شما حرف می زنند !

داده کاوی


اعداد به صورت ذاتی نه خسته کننده هستند و نه هیجان انگیز ! واقعیت این است که آن ها به سادگی به کلاسی از اطلاعات تعلق دارند که مقدار کمی (عددی) چیزی را نشان میدهد .. به عنوان یک متخصص، گاهی مسئولیت و زمانی هم نیاز شماست که صدا و داستان درون اطلاعات را آشکار کرده و زبانی را انتخاب کنید برای ارائه آن اطلاعات به دیگران . یکی از زبان های پیشنهادی به شما مصور سازی اطلاعات با کمک گرفتن از گراف ها و جداول و یا در حالت کلی تر چارت هاست . 
گراف ها و جداول برای اطلاعات عددی کسب و کارهای متفاوت با 4 "هدف" مورد استفاده قرار می گیرند :گراف ها و جداول برای اطلاعات عددی کسب و کارهای متفاوت با 4 "هدف" مورد استفاده قرار می گیرند :
آنالیز :
 وقتی از گراف ها و جداول برای بیرون آوردن پیام و یا موضوع خاصی که درون داده ها است استفاده می کنید شما در حال آنالیز کردن هستید .

ارتباطات :

هنگامی که برای رساندن اطلاعات به افراد دیگر از مصورسازی داده ها استفاده می کنید در حال ایجاد ارتباط هستید.

مانیتورینگ : 

و هنگامی که از گراف ها و جداول برای پیگیری اطلاعات عملکردی مثل سرعت یا کیفیت تولید استفاده می کنید در حال مانیتورینگ داده های خود هستید .

برنامه ریزی :

زمانی که از آن ها برای آماده شدن برای آینده و پیش بینی استفاده می کنید در مرحله برنامه ریزی هستید . 


تمام این موارد استفاده های مهم از گراف ها و جداول هستند ، ولی فرآیند انجام هر کدام و طراحی های مربوط به هر کدام متفاوت هستند . 

مطالبی که پیرامون گراف ها و نمودار ها منتشر می شوند  برای افرادی است که درگیر داده ها برای ارائه گرافیکی اطلاعات عددی می باشند . این افراد دارای یک سمت شغلی یکسان و ثابت نیستند . بعضی از ما متخصص تولید گزارش ها و آنالیز هستیم و معمولا در سمت شغلی خود واژه "آنالیز " را به یدک می کشیم : مثل متخصص آنالیز داده های مالی ، متخصص آنالیز داده های کسب و کار ، متخصص آنالیز داده ، مسئول آنالیز و تصمیم گیری و غیره ... .و بعضی دیگر دارای مسئولیت های مدیریتی می باشیم و به صورت مناسبتی مجبور به ساخت جداول و گراف ها برای مدیران ارشد خود می شویم . تعدادی هنرمندهای گرافیک هستیم که چون مشتری از ما خواسته که منظورش را با گراف نشان دهیم مسئول تهیه گراف ها و نمودار ها از داده های او برای طراحی می شویم.

باقی در اجزای مختلف سازمان حضور داشته و صرفنظر از عنوان شغلی ما اگر مسئول تهیه گزارش به صورت مصور هستیم باید بدانیم چطور آن را "درست " انجام دهیم . برای این کار باید زبان پردازش داده و ارائه آن را بیاموزیم . تکنولوژی کافی نیست .

پردازش داده


» چنانچه با خواندن این مقاله به موضوع هوش تجاری و داده ها علاقه مند شدید، خواندن مطالب زیر را به شما پیشنهاد می کنیم:

هوش تجاری داده کاوی
چرا شرکت ها به هوش تجاری نیاز دارند اشتباهات بزرگ در زمینه مصورسازی اطلاعات در فرآیند هوش تجاری در 20 سال گذشته

این داده چه شکلی است ؟ - هیستوگرام

گاهی لازم است بدانیم که محصولات در کدام بازه های قیمتی، بیشترین فروش و کمترین فروش را دارند . گاهی لازم است وضعیت پرسنلی کارمندان را بررسی کنیم و بدانیم کدام گروه سنی اکثریت نیروی انسانی را تشکیل می دهند یا کدام رنج حقوقی بیشترین فراوانی را در شرکت دارد . گاهی می خواهیم نمود های غیرعادی و نقاط پرت را بررسی کنیم و از وجود آنها مطلع شویم و بسیار مواقعی که نیاز به یک شمای کلی از داده های خود به منظور تصمیم گیری داریم ولی نمی توانیم به راحتی و در زمان کم به آن دسترسی داشته باشیم. 



هیستوگرام : 

نموداری که موضوع بحث است نموداری بسیار کارآمد و مناسب در حوزه ارائه داده ها و هوش تجاری است که به دلیل شباهت زیاد به نمودار میله ای ، فراموش شده است . هیستوگرام نوعی ارائه گرافیکی توزیع ( پراکندگی ) داده های عددی است . این نمودار اولین بار در سال 1891 توسط کارل پیرسون معرفی شد و نام آن را از مخفف "historical diagram  " به معنی  "نمودار تاریخی " ساخت . 



تجربه نشان داده است که حتی بسیاری از افرادی که تجربه مصورسازی داده ها دارند، هنگام درک و یا خواندن هیستوگرام به مشکل بر می خورند . هیستوگرام گرافیست که از لحاظ ظاهری شبیه به نمودار میله ایست و گاهی با آن اشتباه گرفته می شود . البته که هر دو این نمودار می توانند تعداد داده ها را برای کاربر شمرده و به صورت گرافیکی به او نشان دهند ، اما یک نمودار میله ای تعداد واقعی داده ها در دسته بندی های متفاوت ابعاد گوناگون داده نشان میدهد  (طول میله نشان دهنده تعداد داده در آن دسته از بعد مورد نظر است)،  این در حالی است که هیستوگرام همان داده دسته بندی شده را در طبقه های متفاوت نشان می دهد .
در اصل بهتر است نتیجه گیری کنیم که هر نمودار اساسا نوع متغیرهای متفاوتی را به نمایش می گذارند . با تمام این توضیحات همیشه در نظر داشته باشید که فضاهای خالی بین میله های نمودار در نمودار میله ای معنی خاصی ندارند ، این در حالی است که اگر فضایی خالی بین میله ها در هیستوگرام ایجاد شود معنی می دهد و نشان دهنده ی خالی بودن آن طبقه از داده هاست . 


طبقه (bin) به چه معنی است ؟
وقتی که یک هیستوگرام می سازید در واقع در حال ساختن یک نمودار میله ای هستید که نشان میدهد  چه تعداد داده در آن بازه که طبقه نامیده می شود ، قرار دارند . معمولا تعداد این طبقات 5 تا 20 می باشد . قانون از پیش تعیین شده ای برای این اعداد وجود ندارد ، صرفا یک قانون سر انگشتی است به این منظور که کمتر از 5 طبقه هیستوگرام بدون پیام و بیشتر از 20 طبقه دارای پیچیدگی زیادی هنگام خواندن خواهد بود . البته لازم به ذکر است که در مواردی خاص هنگامی که داده ها دارای طبقه بندی خاص و از پیش تعیین شده مد نظر سازمان یا افراد بخصوص است ، هیستوگرام با توجه به خواسته و نیاز آنها با همان طبقه های از پیش تعیین شده کشیده می شود . به عنوان مثال گروه سنی در جوامع متفاوت ، متفاوت نام گذاری می شود . در هر جامعه ای به اقتضای فرهنگ ها و تعاریف اجتماعی گروه های سنی مثل جوان ، نوجوان و ... را در رنج سنی های متفاوت مشخص می کنند . 


همانطور که پیشتر هم اشاره کردیم یکی از اهداف اصلی استفاده از هیستوگرام ارائه گرافیکی توزیع داده هاست . در دنیای تغییرات ،سایه ها و مملو از پیوستگی ،معیارهای متوسط همیشه کافی نخواهند بود و گاهی باعث گمراهی می شوند .گاهی لازم است که شکل پراکندگی و توزیع داده به صورت کلی نمایش داده شود . سه ویژگی کلیدی از مصورسازی توزیع داده ها عبارتند از :
- گستره داده : مقادیر بیشینه و کمینه و همچنین فاصله بین آنها
- مرکزیت : طبقه ای از داده بیشترین فراوانی دارد ( معمولا اتفاق می افتد )
- شکل : شمای کلی داده در یک نگاه
موارد ذکر شده در تصمیم در مورد نوع توزیع داده ها و همچنین تصمیم گیری اساسی با توجه به داده های موجود بسیار تعیین کننده هستند . 
در بررسی یک هیستوگرام و به صورت کلی بررسی توزیع داده به موارد زیر دقت نمایید و در صورت مشاهده بررسی بیشتر انجام دهید :
نقطه اوج( peak  )  
فاصله های خالی
نقاط تمرکزی 
نقاط پرت 


نمودار جعبه ای - هنگامی که میانگین دروغ می گوید !

یکی از علل استفاده از روش های  مصورسازی اطلاعات برای آنالیز داده ها دستیابی و درک سریع اطلاعات و الگوهای موجود مثل شناسایی الگوی فروش محصولات و ترجیحات مصرف کنندگان با توجه به ویژگی های مختلف از جمله ویژگی های جغرافیایی است.با افزایش رویکرد های ممکن برای مصورسازی اطلاعات ، سوالات در خصوص اینکه کدام روش چه زمانی و در جواب چه پرسشی  باید استفاده شود، افزایش می یابند.  در این بحث به معرفی نمودار جعبه ای ، نحوه خواندن آن ، همچنین یک مورد استفاده آن پرداخته شده است. نموداری که بسیاری برای ارائه داده های خود استفاده نمی کنند به این دلیل که باور دارند نمودار جعبه ای تخصصی است .  ولی حقیقت این است که نمودار جعبه ای یکی از ساده ترین نمودارها و جزء آن دسته از روش های مصورسازی است که به شما این امکان را می دهد تا در کمترین زمان با یک نگاه نکات بسیار مفیدی از داده ها استخراج کنید . 



نمودار جعبه ای بعد از هیستوگرام یکی از ابزارهای مفید و کار آمد برای درک توزیع و پراکندگی داده هاست که در موارد مختلف به صورت وسیع به کار می آید و همانطور که بررسی شد برخلاف تصور برخی افراد ، تفسیر و درک اطلاعات آن آنالیز را دچار هیچ چالشی نمی کند . 
نمودار جعبه ای دارای دو بخش جعبه و میله های بیرون آمده است . داده ها در این نمودار به 4 قسمت تقسیم می شوند : 


 قسمت اول داده ها یا عددی که ¼ مقادیر از آن عدد کوچکترند که به آن مینیمم موثر می گویند و به بیانی دیگر  نقطه ای است که 25% داده ها مقداری کمتر از این مینیمم موثر را دارا هستند،
قسمت دوم یا عددی که ½ مقادیر از آن عدد کوچکترند که به آن میانه می گویند و به بیانی دیگر نقطه ای است که نصف داده ها مقادیری کمتر از آن دارند . و در کنار آن ( خط نقطه چین ) میانگین که مقدار متوسط داده های مورد بررسی را ارائه می دهد . 
قسمت سوم یا عدد یا مقداری که ¾ مقادیر از آن عدد کوچکترند که به آن ماکزیمم موثر می گویند و به بیانی دیگر نقطه ای است که 25% داده ها مقداری بیشتر از این ماکزیمم موثر را دارند . 
و قسمت چهارم داده ها که شامل 25درصدهای بالایی و پایینی می باشد و با قسمت بیشترین مقدار و کمترین مقدار داده  میله ها را تشکیل می دهند . 
بعد از رسم نمودار جعبه ای شما به واقع جعبه ای را مشاهده می کنید که دو میله از آن بیرون آمده است ، نقطه ای که انتهای میله ی بالایی جعبه است نقطه مقدار ماکزیمم ( بیشینه ) و نقطه ای که انتهای میله ی پایینی جعبه قرار دارد مقدار مینیمم ( کمینه ) داده ها است  . 

برای مثال وضعیتی را در نظر بگیرید که مدیر یک شرکت کانادایی با دامنه فعالیت بین المللی قصد دارد میزان فروش محصولات خود را در طول زمان در کانادا بررسی کند . 
برای او مهم است که کمترین و بیشترین هزینه ای که مشتری برای کالاهای او پرداخت کرده چقدر بوده است ؟
میزان خرید مشتری به صورت معمول چقدر است ؟ 
آیا اکثریت هزینه ی زیادی را برای کالاهای او صرف می کنند ؟
تجمع مشتریان برای کالاهای با هزینه کمتر است ؟ 
آیا تغییر پذیری در هزینه ی صرف شده توسط مشتری زیاد است ؟ 

 برای پاسخ به اینگونه سوالات از نمودار جعبه ای استفاده می شود . 



همانطور که می بینید میزان هزینه ای که مشتریان برای کالاهای این شرکت در کانادا پرداخت می کنند بین 1000 دلار تا 6061 دلار تغییر می کند . معمولا و به طور میانگین هزینه ای که برای کالاهای این شرکت اختصاص داده می شود برابر 3174.12 دلار است ولی مشهود است که حداقل نصف مشتریان کمتر از 2650 دلار خرید می کنند . و 25% از مشتریان حتی کمتر از 2295 دلار خرید می کنند . میزان خرید مشتریان این شرکت در کانادا تغییرپذیری چشمگیری را بیرون بازه ی 2295 تا 4528 نشان نمی دهد . 
حال به دلیل نیازهای اطلاعاتی مدیر لازم می داند که این موارد را در مورد مشتریان در خارج از کشور مادر و با تقسیم-بندی بازار به زنان و مردان نیز بررسی کند . 


همانطور که مشاهده می شود بیشترین و کمترین هزینه صرف شده برای خرید کالاهای این شرکت حساس به جنسیت نیست و بین زنان و مردان اختلاف چندانی وجود ندارد . ولی اختلاف میزان خرید مشتری در کشورهای مختلف مشهود است . مثلا در فرانسه میزان خرید بین 1120 دلار و 13266دلار قرار دارد که همانطور که مشخص است از تقریبا 5000 دلار تا 13266 دلار تغییرپذیری بسیاری وجود دارد . این در حالی است که نصف افراد تقریبا 2000 دلار برای خرید کالاهای این شرکت هزینه می کنند . 
هنگامی که قصد داریم ارزش یکسانی را در مجموعه های مختلف  به مقایسه بگذاریم نمودار جعبه ای گزینه ی خوبی از لحاظ بررسی بیشینه ها کمینه ها و دیگر اطلاعات آنالیزی مفید که پیشتر بیان شد است . این نمودار از قضاوت اشتباه در مورد داده ها با استناد به پارامترهای مرکزی مثل میانه و میانگین ، با در اختیار گذاشتن هر دو و ایجاد امکان مقایسه ، جلوگیری میکند . به همین صورت توجه را به سوی مسئله پراکندگی و تغییرپذیری داده ها جلب میکند . با اینکه درک مقوله ی تغییرپذیری به نظر دشوارتر از پارامترهای مرکزی است ، ولی مسئله ای واقعی است که با نمودار جعبه ای آسان تر دیده می شود .