You are on page 1of 26

‫𝑵𝑻‪𝑻𝑷+‬‬

‫= ‪Probability of correct diagnosis‬‬ ‫𝒍𝒂𝒕𝒐𝑻‬


‫احتمالية التشخيص الصحيح‪:‬‬
‫‪Correlation Analysis‬‬
‫‪Correlation‬‬
‫يعني العالقة بين متغيرين ممكن عالقة طردية ‪+‬او عكسية –‬
‫نكدر نمثل عالقتهم بشك ل‬
‫‪Scatter plot‬‬

‫اللي هو هذه االرقام حطيناهم بمخطط‬

‫هذا من يطلب بالسؤال نرسم بس نخلي ال و‪Y‬و‪ X‬ونحط نقاط‪.‬‬


‫‪Correlation Coefficient‬‬
‫هذا معامل االرتباط بين ‪ X and y‬هذا يحدد قوة و اتجاه االرتباط بينهم‬

‫رمز المعامل هو ‪r‬اذا جان المعامل مال ‪ sample‬و‪p‬‬


‫اذا جان لل ‪Population‬‬
‫المعامل رح يكون دائما بين ‪ +1‬و‪ ,-1‬و اذا جان قريب عال ‪+1‬‬
‫يعني المتغيرين ارتباطهم قوي و باالتجاه الموجب (كلما يزيد‬
‫ال ‪ x‬يزيد ال ‪,)y‬‬
‫اذا جان قريب عال ‪ -1‬هم يعني ارتباطهم قوي بس باالتجاه‬
‫السالب و عكس الحالة االولى‪ .‬أما اذا جان ‪ 0‬يعني ماكو ارتباط‬
‫بينهم‪.‬‬
‫مثال ‪ r = -8.0‬يعني ارتباطهم قوي بس بالسالب‪ ,‬و ‪r =0.4‬‬
‫يعني ارتباط ضعيف بس باالتجاه الموجب‪.‬‬
‫طريقة الحل‪:‬‬
‫‪ .1‬نجمع قيم )‪x‬‬
‫‪ .2‬نجمع قيم)‪(y‬‬
‫‪ .3‬نضرب ‪x*y‬بعدين نجمع‬
‫‪ .4‬نربع كل ‪ X‬وحدهة ونجمعهن‬
‫‪ .5‬نربع كل ‪ Y‬وحدهة بعدين نجمعهم‬
‫‪ .6‬نستعمل القيم اللي طلعناهن بهذا القانون‬

‫‪ n‬هو عدد المتغيرات‪.‬‬


Example 1
The time 𝑥 in years that an employee spent at a
company and the employee's hourly pay, y, for
5 employees are listed in the table below.
Calculate and interpret the correlation coefficient r.
Include a plot of the data in your discussion.
‫هنا يريد المعامل والشرح او المعنى مالته اللي هي االتجاه سالب‬
.‫او موجب وقوة االرتباط قوي او ضعيف‬

r= 0.97
Interpret this result: There is a strong positive correlation
between the number of years and employee has worked and the
employee's salary, since r is very close to 1.
‫ وباالتجاه‬1 ‫بالشرح نكتبله اكو ارتباط قوي الن كلش قريب من‬
‫ * وهي هاي كليشة نحفظهة‬.‫الموجب‬
‫هذه لحد يقراهة مالهة معنى ‪Significance level‬‬
‫‪The Population Correlation Coefficient ρ-value‬‬

‫طريقة الحل‪:‬‬
‫‪ .1‬اول شي نحدد عدد األزواج ‪ n‬يعني عدد متغيرات ‪ X‬مثال‪.‬‬
‫من السؤال هي دائما معطاة في السؤال‪.‬‬ ‫‪ .2‬نطلع قيمة الفا‬
‫‪ .3‬نطلع ‪ critical value‬من الجدول باالعتماد على قيمة الفا و‪n‬‬
‫‪ .4‬نقارن قيمة ‪ r‬بال ‪ critical value‬اللي طلعناهة من الجدول‬
‫بهذه الطريقة‪:‬‬
‫نقارن ‪ r‬بالقيمة ونشوف اذا هي ‪ Significant‬لو ال من هاي‬
‫ال ‪ 0.811‬هاي من الجدول نطلعه و نقارن اذا جان مطلق ‪ r‬اكبر منهة‬
‫يعني ‪ .Significant‬مثال‬

‫مثال هاي منطي بالسؤال الفا ‪ 0.05‬و ‪n 6‬‬


‫على هذا األساس اختارينة القيمة الحرجة ‪0.811‬‬
‫*مالحظة‪ :‬الفا ممكن يسميهة ‪ Alpha‬او )‪(Level of significance‬‬
‫‪ ,‬و الجدول ممكن ويا السؤال(نستعمله نفسه) او بنهاية األسئلة‪.‬‬ ‫او‬
‫هو ممكن ينطي اكثر من الفا بالجدول عادي نهمل الثانية و ناخذ اللي‬
‫عدنة نطلع منهة القيمة‪ ,‬مثال بهذا المثال منطي الفا ‪ 0.05‬و بالجدول‬
‫منطي قيمتين نعوف الفا ‪ 0.01‬و نطلع القيمة من العمود الفا ‪. 0.05‬‬
‫ نكتبله هاي الكليشة مثال‬interpret ‫ من يطلب نشرحله رح يكول‬.5
‫حسب كل سؤال مو ثابتة لكل األسئلة بس بنفس الطريقة‬

(If |𝑟| > critical value, the correlation is significant. Otherwise,


there is not enough evidence to support that the correlation is
significant).*
The correlation is significant at 5% significance level.
‫او‬
The correlation is not significant at 5% level of significance.
.‫وحسب كل سؤال‬

r ‫هنا طلع بس ال‬


‫بالتكملة هنا منطي الفا وجدول ومطلع ‪ r‬اذا ‪ Significant‬او ال‬
‫‪Hypothesis testing‬‬
‫هذا ينطي العالقة بين متغيرين او اكثر و اكدر اطلع منه ‪ r‬لل ‪Sample‬‬
‫هنا عدنة )‪ null hypothesis (𝐻0‬و )𝑎𝐻( ‪alternative hypothesis‬‬
‫هذني رح نكتبهن بس مراح نحتاجهن الن من خاللهن رح نعرف اذا جانت‬
‫‪ one tailed or two tailed‬و بما انه احنا مناخذ بس ال ‪two tailed‬‬
‫(‪ two tailed‬هذه نحتاجهة بالجدول اللي رح نطلع منه قيم رح نشوفهة بعد شوية)‬
‫يعني منفكر بيهة بس نكتب كل وحدة شتساوي بالورقة مال حل‪.‬‬
‫طريقة الحل‪:‬‬
‫‪ .1‬نكتب (‪ H0‬و‪ ) Ha‬كل وحدة شكد تساوي (ينطيهة بالسؤال)‬
‫‪ .2‬نكتب الفا شكد تساوي‬

‫‪ .3‬ننقص عدد ‪ n-2‬و ناخذ القيمة ي‬


‫الل تطلع بعد نعوف القديمة‬
‫‪ .4‬نروح على هذا الجدول اسمه‪t-disturbution‬‬
‫نطلع القيمة من الجدول حسب المعطيات اللي عدنة ونحطهة على خط اعداد مثل‬
‫المثال اللي رح يجي‬
‫ من القانون‬t ‫ نطلع قيمة‬.5

‫ و نشوف اذا ضمن مجال القيمة اللي طلعناهة من الجدول نكول‬t ‫ نقارن قيمة‬.6
‫اما اذا خارج المجال نكول‬fail to reject the null hypothesis
The test statistics falls in the rejection region, so H0 is rejected

Example 4
The following data represents the number of hours 12
different students watched television during the weekend
and the scores of each student who took a test the
following Monday.

The correlation coefficient r= −0.831. Test the


significance of this correlation coefficient significant at
alpha = 0.01?
‫هنا ال ‪ t=-4.72‬مطلعهة من القانون و ‪ 3.169‬من الجدول مال ‪t-disturbution‬‬
‫ال ‪ t‬طلعت خارج المجال مال ‪ 3.169‬لهذا السبب ‪ H0‬مرفوضة‬
‫‪Pearson Correlation & Spearman rank correlation‬‬
‫اثنينهن قيمهن رح تتراوح بين ‪+ 1‬و ال‪.-1‬‬
‫‪Pearson correlation coefficient‬‬
‫هذا القانون مال بيرسن‬
‫ينحل بنفس الطريقة بس القانون يختلف‬
‫نطلع المين مال ‪ X‬و ‪Y‬‬
‫الل موجود بالقانون‬
‫و نطرح و نجمع مثل ي‬

‫‪Where‬‬ ‫‪is the mean of variable 𝑥 values, and 𝑦 is the‬‬


‫‪mean of variable 𝑦 values.‬‬
‫الحل بسيط بس نسوي جدول ونجمع ونطرح ونعوض‬
‫نفس القانون بس أوضح شوية‬

‫‪Spearman rank correlation‬‬


‫هذا القانون مال رانك‬

‫‪Where: 𝜌 = Spearman rank correlation coefficient‬‬


‫‪di‬هذا الفرق بين المتغيرات المتقابلة )‪(X-Y‬‬
‫‪ n‬هذا عدد األزواج (عدد المتغيرات)‬
‫نفس اللي قبلهة ‪ 1-‬يعني ارتباط قوي سالب بين المراتب ‪ 1+‬يعني ارتباط قوي‬
‫موجب‪ ,‬كلما يكون المعامل قريب من الصفر يكون اضعف‪.‬‬

‫طريقة الحل‪:‬‬
‫‪ .1‬نسوي جدول و نحط ‪ X‬و ‪ Y‬بنفس ترتيبهم‪.‬‬
‫‪ .2‬نرتبهم تنازليا من الرقم الكبير للصغير‪.‬‬
‫‪ .3‬نشوف كل رقم بالترتيب القديم شكد صار ترتيبه بعد ما رتبناهم تنازليا‪ ,‬مثال‬
‫بالمثال اللي جوة بال‪ X‬ال‪ 20‬بعد ما رتبناهة تنازليا ترتيبهة طلع ‪ 4‬فحطينة كدامهة‬
‫الل هو الرانك مالتهة و ‪ 8‬صارت اخر وحدة حطينة كدامهة ‪ 10‬و هيج نكمل‬ ‫‪ 4‬ي‬
‫التتيب القديم‪.‬‬ ‫البقية‪ .‬يعن المرتبة نطلعهة من ال رتتيب الجديد و نحطهة كبال ر‬
‫ي‬
‫‪ .4‬نطرح كل ‪ Rank x‬بال ‪ Rank y‬المقابل اله‪.‬‬
‫‪ .5‬نطلع‪.𝑑𝑖 2‬‬
‫ونستعمل القانون‪:‬‬
:‫مثال‬

x Rank x y Rank y di 𝑑𝑖 2
20 29 4 20 26 7 -3 9
23 23 2 25 25 2 0 0
8 21 10 11 24 10 0 0
29 20 1 24 23 3 -2 4
14 18 7 23 22 4 3 9
12 17 8 16 21 8 0 0
11 14 9 12 20 9 0 0
21 12 3 21 16 6 -3 9
17 11 6 22 12 5 1 1
18 8 5 26 11 1 4 16
∑ 48

6∗48
ρ=1-10(10−1)

ρ= 0.71
‫‪Linear Regression‬‬
‫هذا ينطي معادلة خط‪ ،‬و هنا كلش كلش مهم نعرف منو ‪ X‬منو ‪ ,Y‬ومن خالله نكدر‬
‫نطلع قيمة جديدة لل‪ X‬او‪Y‬‬
‫𝒃 ‪ŷ = 𝒎𝒙 +‬‬
‫هذه المعادلة كلش بسيطة بس نطلع ‪ m‬و ‪ b‬ونحطهن بالمعادلة‪.‬‬

‫)𝑦 ∑∗𝑥 ∑(‪𝑛 ∑ 𝑥𝑦−‬‬


‫=‪m‬‬ ‫‪2‬‬ ‫منا نطلع ‪ ,m‬بس نسوي جدول و نحل عادي‪.‬‬
‫)𝑥 ∑(‪𝑛 ∑ 𝑥 2 −‬‬

‫𝑦∑‬ ‫𝑥∑‬
‫= ‪b= ȳ-mX‬‬ ‫‪−‬‬ ‫نطلعهة منا ‪. mean y – m*mean x‬‬
‫𝑛‬ ‫𝑛‬
‫ال ‪b‬‬
‫الل‬ ‫الرسم سهل اول شي نسوي محور ‪ X , Y‬و نحط كل نقطة ي‬
‫يعن كل ‪ X‬و ال ‪ Y‬ي‬
‫تصت نقطة مثل )‪(2,-1‬‬
‫تقابلهة ر‬
‫و ال )‪ Mean(x‬و )‪ Mean (y‬هم يصيرن نقطة و الخط يمر بيهن الزم‬
‫مثل ما موضح بالمثال‪.‬‬
‫أول شي طلب بال مثال المعادلة مال خط هاي سهلة‬

‫ثاني شي طلب درجة االختبار لطالب يشاهد التلفاز ‪ 9‬ساعات باليوم و ال ‪9‬‬
‫مموجودة بالجدول مال ‪ X‬يعني الزم نطلعهة من المعادلة بهاي الطريقة‪.‬‬
‫مالحظة* عدد ساعات مشاهدة التلفاز هو ‪ X‬و درجات االختبار هي ‪.Y‬‬

‫بس نجيب المعادلة مال المطلب األول نعوض بدال ال ‪ X‬الرقم‪ ،‬بهذا المثال ‪9‬‬
Measures of Regression and Prediction Intervals
Variation About a Regression Line
‫ و‬Total deviation ‫ الزم نطلع‬Total variation ‫من يطلب‬
Unexplained deviation‫ و‬Explained deviation
.‫و اني ماعرف شنو ذني بس منحتاج بس نطبق قوانين و هاهية‬
Total deviation = Yi - ȳ : ȳ ‫ ناقص‬Y ‫هنا كل عنص‬
Total variation = ∑(yi − ȳ)2 : ‫هنا نفس الشي بس نربع النواتج و نجمعهم‬
Explained deviation = ŷi - ȳ ‫ نطلعهة من المعادلة مال‬ŷi ‫ال‬
‫ بال بالمعادلة‬X ‫ نعوض كل‬Regresion
Explained variation = ∑ (ŷ𝑖 − ȳ)2 ‫اللي طلعناهة فوك ونربع و نجمع‬
Unexplained deviation = Yi – ŷi :‫ اللي طلعناهة‬ŷ ‫ نطرحهة من ال‬Y ‫كل‬
Unexplained variation = ∑ (𝑦𝑖 − ŷ𝑖)2
Total variation = Explained variation + Unexplained variation

‫ و رح يطلع‬X ‫ هنا تعوض‬ŷ = 𝒎𝒙 + 𝒃


ŷi
Coefficient of Determination

𝑒𝑥𝑝𝑙𝑎𝑖𝑛𝑒𝑑 𝑣𝑎𝑟𝑖𝑎𝑡𝑖𝑜𝑛
𝑟2=
𝑡𝑜𝑡𝑎𝑙 𝑣𝑎𝑟𝑖𝑎𝑡𝑖𝑜𝑛
Example 2 (cont.):
The correlation coefficient for the data that represents the
number of hours students watched television and the test
scores of each student is r  −0.831.
Find the coefficient of determination.
R=𝑟 2 ≈ (−0.831)2 ≈ 0.691
About 69.1% of the variation in the test scores can be explained
by the variation in the hours of TV watched. About 30.9% of the
variation is unexplained.
.r ‫مالحظة انه احنا نكدر نربع اذا جان منطينة‬

The Standard Error of Estimate


‫هنا نفس ما حجينة فوك نسوي جدول و نعوض‬
‫ بالمعادلة مال ريغريشن رح تطلعلنة‬X ‫كل‬
‫ نطرح و نرب ع و نجمع عادي‬ŷi
:‫طريقة الحل‬
‫ نسوي جدول نحط بيه‬.1
Xi,Yi,(yi-ŷi),(𝑦𝑖 − ŷ𝑖)2
‫ر‬
‫حن نطلع‬ ‫ بالمعادلة‬X ‫ نعوض كل‬.2
.ŷi
.‫من الجدول‬ ‫ نطلع‬.3
‫‪.‬‬ ‫‪ .4‬نستعمل القانون‬

‫مثل مكلنة هنا معوض ال ‪ X‬بالمعادلة ومطلع ‪ŷi‬‬


‫‪Prediction Intervals‬‬
‫‪ŷ–𝑬<𝒚<ŷ+E‬‬ ‫هنا يريد ال‪ Y‬قيمتهة موجودة بين هذني‬
‫نحتاج نطلع قيمة ‪ ŷ‬حسب ال ‪ X‬المطلوب يعني نعوضه بمعادلة ‪ŷ‬‬
‫‪.ŷ = 𝑚𝑥 + b‬‬

‫ال ‪ Error‬من هذا القانون يطلع‬

‫نطلعهة من الجدول ‪tc‬‬


‫نعوض بمكان ‪ X0‬ال‪ X‬المطلوبة‬
‫الباقيات عادي نفس قبل‪.‬‬
‫طريقة الحل‪:‬‬
‫نطلع ‪.n – 2‬‬
‫نستعمل المعادلة 𝑏 ‪ ŷ= 𝑚𝑥𝑖 +‬و نعوض بيهة قيمة ‪ X‬المطلوبة بالسؤال تطلع ‪ŷ‬‬
‫نطلع قيمة ‪ tc‬من الجدول‬
‫نحتاج ‪ n – 2‬و هو رح ينطينة ‪. Level of confidence‬‬

‫هيج نطلع ‪tc‬‬


‫نطلع ‪ Se‬من القانون‬

‫نستعمل القانون‬
‫نبقي ال ‪ Y‬و نطرح ‪ ŷ‬من ‪E‬‬ ‫اخر شي نطبق‬
‫و الطرف األيمن رح نجمع ‪E + ŷ‬‬
‫رح تكون ‪ Y‬بين قيمتين وهو هذا المطلوب‪.‬‬

‫هو هنا منطيني كلشي بس اطلع ‪ tc‬من الجدول منطي النسبة ‪ %95‬و‬
‫‪ 10=n – 2‬و ال ‪ X‬المطلوبة ‪4‬‬

‫طلعت ال ‪ Y‬بين ‪ 96.44‬و ‪58.94‬‬


‫‪Multiple Regression‬‬
‫‪Multiple Regression Equation‬‬
‫هذا موضوع كلش بسيط نفس إيجاد معادلة ال ‪Regression line‬‬
‫بس يختلف بكونه بيه أكثر من ‪ X‬يعني ‪ X 1‬و ‪ X 2‬و ممكن اكثر حسب هاي‬
‫المعادلة … ‪ ŷ = b + m1x1 + m2x2 + m3x3 +‬رح نشتغل‬
‫و ماتصور يجي اكثر من ‪2‬‬
‫هذا اذا عدنة اثنين بس ‪ŷ = 𝒃 + 𝒎𝟏𝒙𝟏 + 𝒎𝟐𝒙2‬‬
‫هذه قوانين ال ‪ m‬مال هاي الحالة‬

‫و هذا قانون ال ‪b‬‬


‫سهل مابيه شي بس حفظ قوانين‬

‫هنا منطيني كلشي بس اعوض ‪ X1‬و ‪X 2‬‬


‫هذا هوم ورك ممحلول بس هو منطيني كلشي‪.‬‬
Sol:
ŷ= b +m1x1+m2x2
(∑ 956)(504)−(900)(524)
m1 = (576)(504)−(524)2
= 0.650051
‫)‪(900)(576)−(956)(524‬‬
‫=‪m2‬‬ ‫‪(576)(504)−(524)2‬‬
‫‪= 1.10987‬‬
‫‪80‬‬ ‫‪180‬‬ ‫‪120‬‬
‫=‪b‬‬ ‫* ‪– (0.65‬‬ ‫* ‪) – (1.10987‬‬ ‫‪) = -17 .01844‬‬
‫‪10‬‬ ‫‪10‬‬ ‫‪10‬‬

‫طلعنا المطلب األول‬


‫‪ŷ = -17.01844 + 0.65 x1 + 1.10987 x2‬‬
‫هسة يريد اطلع قيمة ‪ ŷ‬من ‪ X1‬تساوي ‪ 28‬و ‪ X2‬تساوي ‪12‬‬
‫بس اعوض بالمعادلة مال ريغريشن اللي طلعتهة و هاهية‬

‫)‪Ŷ= -17.01844+(0.65 * 28)+ ( 1.10987 * 12‬‬


‫‪Ŷ = 14.5‬‬

You might also like