You are on page 1of 7

‫נוסחאון במבוא לסטטיסטיקה‬

‫סטטיסטיקה תיאורית‬
‫‪f‬‬ ‫שכיחות‬
‫= =‪P‬‬ ‫שכיחות יחסית (‪ :)%‬‬ ‫א‪ .‬‬
‫‪n‬‬ ‫גודל המדגם‬

‫שכיחות‬
‫= '‪f‬‬ ‫צפיפות‪ :‬‬ ‫ב‪ .‬‬
‫רוחב הקבוצה‬

‫‪n‬‬
‫מדדי מרכז‪:‬‬ ‫ג‪ .‬‬
‫‪∑ xi fi‬‬
‫= ‪ X = x1 f1 + x 2 f2 + ... + x n fn‬‬ ‫‪i =1‬‬ ‫‪ — X‬ממוצע‪ :‬‬ ‫‪ .I‬‬
‫‪n‬‬ ‫‪n‬‬
‫ ‬
‫‪k‬‬

‫‪x1 f1 + x 2 f2 + ... + x k fk‬‬


‫‪∑ xi fi‬‬ ‫ ‬
‫=‪X‬‬ ‫=‬ ‫‪i =1‬‬ ‫הממוצע ‪ X‬בטבלת השכיחויות‪ :‬‬ ‫ ‬
‫‪n‬‬ ‫‪n‬‬
‫(‪ = k‬מספר הקבוצות בטבלת השכיחויות)‬ ‫ ‬

‫‪ — Me .II‬חציון‪ :‬‬
‫חציון למשתנה בדיד‪ :‬‬ ‫ ‬
‫‪Me = X  n +1 ‬‬ ‫אם ‪ n‬אי–זוגי ‬ ‫ ‬
‫‪‬‬ ‫‪‬‬
‫‪2 ‬‬

‫‪X n  + X n‬‬ ‫‪‬‬


‫‪ ‬‬ ‫‪ +1‬‬
‫‪2‬‬ ‫‪2‬‬
‫= ‪Me‬‬ ‫אם ‪ n‬זוגי ‬ ‫ ‬
‫‪2‬‬
‫חציון למשתנה רציף‪:‬‬ ‫ ‬
‫‪n‬‬ ‫‪‬‬
‫‪Me = L +  – F ‬‬
‫‪f‬‬ ‫‪2‬‬ ‫ ‪‬‬
‫‪‬‬
‫— הגבול התחתון של הקבוצה החציונית‬ ‫‪ L‬‬ ‫ ‬

‫— רוחב הקבוצה החציונית‬ ‫‪ l‬‬ ‫ ‬

‫המשך בעמוד ‪2‬‬


‫‪-2-‬‬

‫— שכיחות הקבוצה החציונית‬ ‫‪ f‬‬ ‫ ‬

‫— השכיחות המצטברת עד הקבוצה החציונית (לא כולל אותה)‬ ‫‪ F‬‬ ‫ ‬

‫‪‬‬
‫‪ — X‬שכיח‬ ‫ ‬
‫השכיח למשתנה בדיד הוא הערך בעל השכיחות הגבוהה ביותר‪.‬‬ ‫‪ .I‬‬ ‫ ‬

‫‪ =L+‬‬ ‫‪f 'i − f 'i−1‬‬


‫‪X‬‬ ‫‪⋅‬‬ ‫‪ . II‬השכיח למשתנה רציף‪ :‬‬ ‫ ‬
‫‪‬‬ ‫) ‪( f 'i − f 'i−1 ) + ( f 'i − f 'i+1‬‬
‫ ‬ ‫ ‬
‫כאשר‪:‬‬ ‫ ‬
‫— הגבול התחתון של קבוצת השכיח‬ ‫‪ L‬‬ ‫ ‬

‫— הרוחב של קבוצת השכיח‬ ‫‪ l‬‬ ‫ ‬


‫— הצפיפות בקבוצת השכיח‬ ‫‪ f 'i‬‬ ‫ ‬

‫‪ — f 'i–1‬הצפיפות בקבוצה שלפני השכיח‬ ‫ ‬

‫‪ — f 'i+1‬הצפיפות בקבוצה שאחרי קבוצת השכיח‬ ‫ ‬

‫המשך בעמוד ‪3‬‬


‫‪-3-‬‬

‫מדדי פיזור‪:‬‬ ‫ד‪ .‬‬


‫‪n‬‬

‫‪(x1 − x)2 f1 + (x 2 – x)2 f2 + ... + (x n – x)2 ⋅ fn‬‬


‫‪∑ (xi − x)2 fi‬‬
‫=‪V‬‬ ‫=‬ ‫‪i=1‬‬ ‫השונות‪ :‬‬ ‫‪—V‬‬
‫‪n‬‬ ‫‪n‬‬
‫‪n‬‬ ‫ ‬
‫∑‬ ‫‪x 2i fi‬‬
‫)‪− ( x‬‬
‫‪i=1‬‬ ‫‪2‬‬
‫=‪V‬‬
‫‪n‬‬ ‫ ‬
‫ ‬

‫‪k‬‬ ‫‪k‬‬
‫∑‬ ‫‪(x i − x)2 fi‬‬ ‫‪∑ x2i fi‬‬
‫)‪− ( x‬‬
‫‪i=1‬‬ ‫‪i=1‬‬ ‫‪2‬‬
‫=‪V‬‬ ‫=‬ ‫השונות ‪ V‬בטבלת השכיחויות‪ :‬‬
‫‪n‬‬ ‫‪n‬‬

‫ ‬
‫‪‬‬ ‫‪ 3‬‬ ‫‪ ‬‬ ‫‪ N‬‬ ‫‪‬‬
‫‪Q 3 − Q1 =  L + ⋅  N – F   –  L + ⋅  − F  ‬‬ ‫התחום הבין־רבעוני‪ :‬‬
‫‪‬‬ ‫‪f 4‬‬‫‪‬‬ ‫‪‬‬ ‫‪ ‬‬ ‫‪f 4‬‬‫‪‬‬ ‫‪‬‬
‫‪‬‬

‫צורות התפלגות פעמוניות‪:‬‬ ‫ה‪ .‬‬

‫התפלגות א–סימטרית‬ ‫התפלגות א–סימטרית‬ ‫התפלגות סימטרית‬


‫שמאלית‬ ‫ימנית‬

‫‪ > Me > X‬‬


‫‪X‬‬ ‫‪ < Me < X‬‬
‫‪X‬‬ ‫‪ = Me = X‬‬
‫‪X‬‬
‫ ‬ ‫ ‬ ‫ ‬

‫ממוצע > חציון > שכיח‬ ‫ממוצע < חציון < שכיח ‬ ‫ממוצע = חציון = שכיח ‬

‫המשך בעמוד ‪4‬‬


-4-

‫רגרסיה לינארית‬
Y‫ ו־‬X ‫ — מקדם מתאם (פירסון) בין המשתנים‬rXY .‫א‬
n n
∑ X 2i
2
∑ Yi2 2
S2X = i =1 –X S2Y = i =1 −Y
n n
n
∑ Xi Yi
SXY = cov ( X, Y) = i =1 − X⋅Y
n

cov ( X, Y)
rXY =

S X ⋅ SY

−1 ≤ rXY ≤ 1

X ‫ על סמך‬Y ‫קו הרגרסיה של‬ .‫ב‬


Y
ˆ =a
Y / X X + bY / X

S
a Y / X = YX bY / X = Y − a Y / X X
S2X

Y ‫ על סמך‬X ‫קו הרגרסיה של‬ .‫ג‬


ˆ =a
X X / YY + bX / Y

SXY
aX/Y = bX / Y = X − a X / Y ⋅ Y
S2Y

5 ‫המשך בעמוד‬
‫‪-5-‬‬

‫הסתברות‬
‫מספר האפשרויות של מאורע ‪A‬‬
‫מאורע ‪ A‬‬ ‫מספר האפשרויות של מרחב המדגם = )‪ = P (A‬ההסתברות של‬
‫‪ 0 ≤ P (A) ≤ 1‬‬

‫)‪ P (A ∪ B) = P (A) + P (B) – P (A ∩ B‬‬

‫)‪ P (A ∩ B) = P (A) ⋅ P (B‬‬ ‫כאשר ‪ A‬ו־‪ B‬הם מאורעות בלתי תלויי ‬


‫ם‬

‫התפלגויות‬
‫)‪X ~ B (n, p‬‬ ‫התפלגות בינומית ‬ ‫א‪ .‬‬
‫‪E (X) = np‬‬ ‫תוחלת ‬
‫)‪ V (X) = npq = np (1–p‬‬ ‫שונות ‬
‫מ–‪ n‬נסיונות( ‪ P‬‬ ‫)(‬
‫= ‪ k) P(X = k ) = nk pk (1 – p)n − k‬הצלחות‬
‫!‪n‬‬
‫!) ‪k !( n − k‬‬
‫‪p k (1 − p) n − k‬‬

‫‪ k = 0 , 1 , 2 , ... , n‬‬

‫‪ 0≤p≤1‬‬

‫התפלגות נורמלית ‬ ‫ב‪ .‬‬


‫)‪X ~ N (µ, σ‬‬

‫ ‬ ‫‪ — m‬ממוצע האוכלוסייה ‬
‫‪ — s‬סטיית התקן של האוכלוסייה‬

‫)‪( z = X − µ  N (0,1‬ציון תקן) ‬ ‫התפלגות נורמלית סטנדרטית ‬ ‫‪ .I‬‬


‫‪σ‬‬
‫‪ P (X ≤ a) = φ  a − µ ‬‬ ‫ ‬
‫ ‬
‫‪‬‬ ‫‪‬‬
‫‪σ ‬‬
‫‪ a − µ‬‬
‫‪P (X > a) = 1 − φ ‬‬
‫‪ σ ‬‬
‫‪ b− µ‬‬ ‫‪ a − µ‬‬
‫‪P (a < X < b) = φ ‬‬ ‫‪−φ‬‬
‫‪ σ ‬‬ ‫‪ σ ‬‬

‫) ( ‪‬‬
‫ ‬ ‫) ‪φ −z = 1 − φ ( z‬‬

‫המשך בעמוד ‪6‬‬


‫‪-6-‬‬

‫‪ .II‬משפט הגבול המרכזי‬


‫‪µ‬‬ ‫יהיו ‪ x1 , x2 , ... xn‬משתנים מקריים בלתי תלויים ושווי–התפלגות בעלי תוחלת‬ ‫ ‬
‫וסטיית תקן ‪ , σ‬המוגדרים על אותו מרחב מדגם‪.‬‬
‫עבור ‪ n‬מספיק גדול מתקיים בקירוב‪:‬‬ ‫ ‬
‫ ‬
‫‪n‬‬
‫‪∑ Xi = Sn  N ( nµ,‬‬ ‫‪nσ‬‬ ‫)‬ ‫התפלגות הסכום‪:‬‬ ‫ ‬
‫‪i=1‬‬
‫‪‬‬ ‫‪σ ‬‬
‫‪X  N  µ,‬‬ ‫‪‬‬ ‫התפלגות הממוצע‪:‬‬ ‫ ‬
‫‪‬‬ ‫‪n‬‬
‫‪‬‬
‫ ‬

‫פונקציות שימושיות באקסל‬ ‫ ‬


‫מניית מספר התאים המכילים מספרים‬ ‫‪ Count‬‬
‫החזרת הערך הגדול ביותר בקבוצת ערכים‬ ‫‪ Max‬‬
‫החזרת הערך הקטן ביותר בקבוצת ערכים‬ ‫‪ in‬‬
‫‪M‬‬

‫סכום כל המספרים בטווח תאים‬ ‫‪ um‬‬


‫‪S‬‬

‫‪ Average/mean‬החזרת ממוצע חשבוני של ארגומנטים‬


‫החזרת הערך השכיח במערך‬ ‫‪ ode‬‬
‫‪M‬‬

‫החזרת הערך החציוני במערך‬ ‫‪ Median‬‬


‫סטיית התקן בהתבסס על מדגם‬ ‫‪ tdev‬‬
‫‪S‬‬

‫שונות המדגם‬ ‫‪ Var‬‬


‫החזרת מידת האסימטריה של ההתפלגות‬ ‫‪ Skew‬‬
‫החזרת ההתפלגות המצטברת הנורמלית עבור ממוצע וסטיית תקן‬ ‫‪ Normdist‬‬
‫החזרת ההתפלגות המצטברת הנורמלית הסטנדרטית‬ ‫‪ Normsdist‬‬
‫החזרת ערך מנורמל מתוך התפלגות המאופיינת על–ידי ממוצע וסטיית‬ ‫‪ tandardize‬‬
‫‪S‬‬
‫תקן‬
‫החזרת מקדם המתאם בין שתי קבוצות נתונים‬ ‫‪ orrel‬‬
‫‪C‬‬

‫החזרת השיפוע של קו הרגרסיה הלינארית‬ ‫‪ lope‬‬


‫‪S‬‬

‫המשך בעמוד ‪7‬‬


‫‪-7-‬‬

‫החזרת הקבוע של קו הרגרסיה הלינארית‬ ‫‪ Intercept‬‬


‫ניכוי ערך עתידי לאורך מגמה לינארית‬ ‫‪ orcast‬‬
‫‪F‬‬

‫החזרת המגמה הלינארית המתאימה לנתונים‬ ‫‪ Linest‬‬


‫החזרת ערך לוגי המבוסס על בחינת ערך תא‬ ‫‪i f‬‬

‫בהצלחה!‬

You might also like