ניתוח גורמים: תהליך עבודה לבנייה איכותית של מדדים מייצגים

בעייה בבניית מדדים

בניית מדד מייצג לסדרת מדידות של תופעה מסוימת, למשל, עמדות כלפי מדיניות ממשלה בעניין מבקשי מקלט, היא אתגר מרכזי בעבודת מחקר. בדרך כלל, הנטייה היא להציג ממוצע פשוט של ערכי המדידות השונות ולהסתפק במדד אלפא קרונבך (Cronbach's Alpha) או מדד המתאם בתוך הקבוצה (Intra-Class Correlation) או שניהם לתמיכה בטיב המדד. למעשה, התהליך מורכב ממספר שלבים קריטיים, אם מתיימרים להגיע למדד מייצג יציב ותקף, ראו איור בהמשך. ראשית, יש לחלק את המדידה לשני מרכיבים: מודל ניתוח גורמים מגשש (Exploratory Factor Analysis) ומודל ניתוח גורמים מאשש (Confirmatory Factor Analysis), כאשר ניתוח גורמים הוא התהליך בו מתכנסים פריטים שונים (למשל, תשובות לשאלון) למדד מייצג, כמוסבר למעלה. יש לפלח אקראית נתונים שנאספו לשני מדגמים עבור תהליך המדידה. מדגם אחד ישמש את התהליך המגשש, תהליך שבו מגששים אומדן למספר המימדים המייצג תופעה כלשהי, או במילים אחרות, כמה מדדים כדאי להרכיב, על מנת שנקבל ייצוג טוב לתופעה. למשל, אם מעבדים שאלות שונות שמטפלות בשחיקה בעבודה, סביר להניח שישנם מספר גורמי שחיקה כמו שחיקה פיזית, נפשית, שחיקה ברמת הארגון וכדומה וכל גורם כזה נמדד על ידי מספר פריטים בשאלון. התהליך המאשש, לעומת זאת, מודד את טיב ההתאמה של מבני המדדים (מדד לא נצפה – Latent Variable), המורכב ממדידות ידועות (Observed Measurements), שנלקחו, בדרך כלל, מתשובות לשאלון. כאן מודגשת ההבחנה בין המשתנה שלא נצפה, והוא נמדד בעקיפין על ידי הפריטים שנמדדו ישירות, לבין אותו מידע שנמדד ישירות. מטרת התהליך לנטרל טעויות מדידה (Measurement Errors), שקשורות בפריטים הנצפים מהמדד הלא-נצפה, כך שמדד זה ייצג את התופעה בניכוי טעויות המדידה. במושג "מאשש", הכוונה לתהליך שמאשש מבנים שכבר נמדדו בעבר על ידי חוקרים אחרים ויש לגביהם תיאוריה מוצקה, כמו בדוגמה של שחיקה בעבודה. כאשר קיים רקע תיאורטי מוצק וברור, נשלב את המודל המאשש (מודל המדידה: Measurement Model) לתוך מערכת משוואות מבניות (Structural Equation Model) ללא צורך במדגם נוסף לאמידת מקדמי הנתיבים (Path Weights).

תהליך המדידה וכלי מדידה שונים

ברמת פירוט גבוהה יותר, כפי שאפשר לראות באיור, התהליך המגשש מתחיל בנתונים חלקיים ומספק מימדים לתהליך השלמת נתונים חסרים (Multiple Imputations for Missing Data), שהוא חיוני לשימוש מלא בכל נתוני המדגם (כלל המשיבים לשאלון, למשל). כאשר מגבשים מספר מימדים לתופעה נחקרת, אפשר לבצע השלמת נתונים לכלל המדגם, כך שכל התצפיות משתתפות בתהליך המדידה. בשלב שני חוזרים לתהליך מגשש, שמספק מימדים למספר המדדים המייצג לניתוח הבא, הניתוח המאשש. כאן ייתכנו מקרים שונים של טיב התאמה נמוך, למרות שהניתוח המגשש הצביע על המבנה הנכון של מדדי התופעה. במקרים אלה אפשר להשתמש בתהליך פיצול (Parceling), שתפקידו להגביר את יציבות המדד. למשל, אם קיימים פריטים שהתפלגותם נוטה לימין, לעומת מדדים שהתפלגותם נוטה לשמאל, שילובים בעזרת שיטת הפיצול ייצור מדד שמתפלג סימטרית. כך, בעזרת מספר חזרות על התהליך ואיתור פריטים שאינם רלוונטיים למדד, אפשר להגיע למדד או מספר מדדים תקפים ויציבים, שאכן, מייצגים את התופעה והם משתלבים במודל משוואות מבניות לבדיקת השערות המחקר.

התייחסות להתפלגות הפריטים

נקודה נוספת להתייחסות היא צורת ההתפלגות המקורית של פריטים שונים. אנחנו מניחים, בדרך כלל, התפלגות נורמאלית, עבור כל המשתנים. בפועל קיימים מקרים בהם ההנחה אינה נכונה והתפלגות של משתנים מסוימים יכולה להיות סדורה (Ordinal), או בצורת מנייה (Count), או משתנים שמיים (Nominal). בכל המקרים הללו יש לקחת בחשבון כי חוסר התייחסות לצורת ההתפלגות עשוי לגרום למדד מוטה (Biased).

ד"ר גבי ליברמן – דטה גרף, מחקר וייעוץ סטטיסטי

אין תגובות