مجال التحليل الإحصائي يمس حياتنا في نواحٍ عدة وآثاره موجودة في كل مكان، ولكن قبل أن نغوص في شتى أعماقه المتداخلة، لابد لنا من تعريفه أولًا، فالتحليل الإحصائي هو علم جمع واستكشاف وتقديم كميات كبيرة من البيانات لاكتشاف الأنماط والاتجاهات الأساسية، كما يتم تطبيق الإحصاءات كل يوم في مجالات كثيرة، منها مجال البحوث والصناعة والتجارة والأعمال الحكومية، لتصبح أكثر علمية حول القرارات التي يجب اتخاذها، فمثلًا يستخدم المصنّعون إحصائيات لنسج الجودة في الأقمشة المصنعة، كما يحافظ الباحثون على صحة الأطفال من خلال استخدام الإحصاءات لتحليل البيانات من إنتاج اللقاحات الفيروسية، والتي تضمن الاتساق والأمان والسلامة لكل الأطفال، أيضًا تستخدم شركات الاتصالات الإحصائيات لتحسين موارد الشبكة، وتحسين الخدمة وتقليل زخم العملاء من خلال اكتساب نظرة ثاقبة أكبر لمتطلبات المشترك, أما عن المجال الحكومي فتعتمد الوكالات الحكومية في جميع أنحاء العالم على الإحصائيات لفهم واضح لبلدانها وأعمالها وشعبها، فكلنا يشاهد مئات المنتجات والعمليات كل يوم الذي تم تحسينها من خلال استخدام الإحصاءات.
يعد مجال التحليل الإحصائي فريدًا من نوعه، فلقد استخدم العلماء الأساليب التقليدية للتحليل الإحصائي من بيانات أخذ العينات إلى تفسير النتائج لآلاف السنين، لكن أحجام بيانات اليوم تجعل الإحصاءات أكثر قيمة وقوة من خلال تخزين الكم الهائل من البيانات في أجهزة الكمبيوتر القوية والخوارزميات المتقدمة التي أدت في النهاية إلى زيادة استخدام الإحصاءات الحاسوبية، فسواء أكنت تعمل مع وحدات تخزين كبيرة للبيانات أو تقوم بتشغيل تباينات متعددة لحساباتك، فقد أصبحت الحوسبة الإحصائية ضرورية للإحصائي اليوم، والإحصائي هو المهتم بمجال الإحصاء بصفة عامة.
تشمل ممارسات الحوسبة الإحصائية الشائعة ما يلي :-
تبدأ من التحليل التقليدي للتباين والانحدار الخطي إلى الأساليب الدقيقة وتقنيات التصور الإحصائي ، فالبرمجة الإحصائية ضرورية لاتخاذ القرارات القائمة على البيانات في كل مجال.
مثل النمذجة والتنبؤ ومحاكاة العمليات التجارية لتحسين التخطيط الاستراتيجي والتكتيكي, كما تطبق هذه الطريقة الإحصاءات على الاقتصاد للتنبؤ بالاتجاهات المستقبلية.
وهي تهتم بتحديد الإجراءات التي ستنتج أفضل النتائج استنادًا إلى العديد من الخيارات والنتائج الممكنة, كما يتم استخدام الجدولة والمحاكاة وعمليات النمذجة ذات الصلة لتحسين العمليات التجارية والتحديات الإدارية.
مثل تقنيات الكمبيوتر القوية لتنفيذ الأساليب الإحصائية الخاصة بك وتحليل البيانات الاستكشافية باستخدام خوارزميات عملية الصف.
يمكن استخدام التحليل الإحصائي السريع والقدرات الاستكشافية في واجهة مرئية لفهم البيانات وبناء النماذج المطلوبة لها.
وهو منهج رياضي لمراجعة خصائص الجودة والسلامة لجميع جوانب الإنتاج.
* تعريف التحليل الإحصائي البسيط
بمجرد جمع البيانات الكمية، سيكون لديك الكثير من الأرقام، فلقد حان الوقت لإجراء بعض التحليل الإحصائي لفهم بياناتك واستخلاصها منها، لذا فنحن نقدم لكم من خلال هذا المقال ملخصًا موجزًا لبعض الأساليب الأكثر شيوعًا لتلخيص بياناتك، وسنشرح متى ستستخدم كل واحدة منها.
* تلخيص البيانات : التجميع والتصور
أول شيء يتعلق بأي بيانات هو تلخيصها، مما يعني تقديمها بطريقة تُروي بشكل أفضل، حيث تتمثل نقطة البداية عادةً في تجميع البيانات الأولية في فئات و / أو تصورها، فعلى سبيل المثال إذا كنت مهتمًا بالاختلافات حسب العم ، فإن أول ما عليك فعله هو على الأرجح تجميع بياناتك في فئات عمرية مختلفة، ربما مجموعات من خمس أو عشر سنوات.
وأحد الأساليب الأكثر شيوعًا المستخدمة في التلخيص هي استخدام الرسوم البيانية، وخاصة المخططات الشريطية، والتي تُظهر كل نقطة بيانات بالترتيب، أو الرسوم البيانية وهي مخططات شريطية مجمعة في فئات أوسع.
الشيء المهم في رسم الرسم البياني هو أنه يوفر لك "صورة" فورية للبيانات، ويعتبر هذا الأمر مهمًا لأنه يوضح لك على الفور ما إذا كانت بياناتك قد تم تجميعها معًا أو انتشارها أو ميلها نحو قيم عالية أو منخفضة أو متجمعة حول نقطة مركزية، مما سيُظهر لك أيضًا ما إذا كان لديك أي "قيم متطرفة" أو قيم بيانات عالية جدًا أو منخفضة جدًا، والتي قد ترغب في استبعادها من التحليل، أو على الأقل إعادة النظر للتحقق من صحتها.
* الفرق بين المخططات الدائرية وتدابير الموقع
تُستخدم على أفضل وجه عندما تكون مهتمًا بالحجم النسبي لكل مجموعة، وما هي نسبة الإجمالي الذي يناسب كل فئة، وذلك لأنها توضح بوضوح المجموعات الأكبر.
2- تدابير الموقع : المتوسطات :-
يمنحك المتوسط معلومات حول حجم تأثير ما تختبره، وبمعنى آخر سواء كان كبيرًا أم صغيرًا، فهناك ثلاثة مقاييس للمتوسط: وهم المتوسط والوسيط والوضع.
* ما الفرق بين المتوسط والوضع والوسيط ومقاييس الانتشار ؟
أيضًا لديه ميزة أنه يستخدم جميع قيم البيانات التي تم الحصول عليها ويمكن استخدامها لمزيد من التحليل الإحصائي، ومع ذلك يمكن تحريفها بواسطة "القيم المتطرفة"، وهي قيم كبيرة أو صغيرة بشكل غير عادي كما قلنا سابقًا
ونتيجة لذلك يستخدم الباحثون أحيانًا الوسيط، وبدلاً من ذلك هذه هي النقطة الوسطى لجميع البيانات، فالوسيط ليس منحرفًا بالقيم المتطرفة، لكن من الصعب استخدامه لمزيد من التحليل الإحصائي.
2- الوضع :-
هو القيمة الأكثر شيوعًا في مجموعة البيانات، حيث لا يمكن استخدامه لمزيد من التحليل الإحصائي.
3- الوسيط :-
تختلف قيمه عن قيم المتوسط والوضع.
هو قياس المدى والتباين والانحراف المعياري.
كما يريد الباحثون غالبًا إلقاء نظرة على انتشار البيانات، أي مدى انتشار البيانات على نطاق القياس الممكن بأكمله، وبمجرد حساب بعض القيم الأساسية للموقع مثل الوسط والحيز والنطاق والتباين لتحديد مستوى الانحراف ، كما يمكنهم أيضًا الانتقال إلى تحليل إحصائي أكثر تقدمًا، والبدء في البحث عن أنماط جديدة في البيانات.
* الإحصائيات الوصفية والاستنتاجية
تحاول الإحصاءات الوصفية وصف العلاقة بين المتغيرات في عينة ما أو مجتمع ما، حيث توفر الإحصاءات الوصفية ملخصًا للبيانات في شكل الوسط والوسيط والوضع، أما الإحصاءات الاستنتاجية تستخدم عينة عشوائية من البيانات المأخوذة من مجتمع ما لوصف وإجراء استنتاجات حول جميع السكان، كما يتم وصف مدى التشتت حول الملاحظات حول موقع مركزي بواسطة الاتجاه المركزي والانتشار نحو الأطراف القصوى بدرجة التشتت.
1- مقاييس النزعة المركزية :-
مقاييس الميل المركزي هي الوسط والوسيط والوضع، فالمتوسط أو (المتوسط الحسابي) هو مجموع كل الدرجات مقسومًا على عدد الدرجات، وقد يتأثر الوسط بعمق بالمتغيرات المتطرفة، فعلى سبيل المثال قد يتأثر متوسط البقاء لمرضى التسمم بالفسفور العضوي في وحدة العناية المركزة بمريض واحد يبقى في وحدة العناية المركزة لمدة 5 أشهر تقريبًا بسبب تسمم الدم.
2- متغيرات الفاصل الزمني :-
متغيرات الفاصل الزمني تشبه إلى حد كبير المتغير الترتيبي، ولكن باستثناء أن الفواصل الزمنية تكون بين قيم المتغير الفاصل الزمني والتي تكون متباعدة بشكل متساوٍ، ومن أمثلة مقياس الفاصل مقياس درجة فهرنهايت المستخدم لقياس درجة الحرارة، فمع مقياس فهرنهايت يكون الفرق بين 70 درجة و 75 درجة مساويًا للفرق بين 80 درجة و 85 درجة، لذا فوحدات القياس متساوية عبر النطاق الكامل للمقياس.