Professional Documents
Culture Documents
Đỗ Xuân Anh
Liệt kê
Liệt kê
1 from c o l l e c t i o n s i m p o r t C o u n t e r
2
3 #C r e a t e a l i s t
4 num_friends =
[100 ,49 ,41 ,40 ,25 ,21 ,21 ,19 ,19 ,18 ,18 ,16 ,15 ,15 ,15 ,15 ,14 ,14 ,13 ,1
5 f r i e n d s _ c o u n t s= C o u n t e r ( n u m _ f r i e n d s )
6 print ( friends_counts )
Mean
1 d e f mean ( x ) :
2 r e t u r n sum ( x ) / l e n ( x )
Median
1 d e f median ( v ) :
2 """ f i n d s t h e ’ m i d d l e −most ’ v a l u e o f v """
3 n = len (v)
4 sorted_v = s o r t e d ( v )
5 m i d p o i n t = n // 2
6
7 i f n % 2 == 1 :
8 # i f odd , r e t u r n t h e m i d d l e v a l u e
9 r e t u r n sorted_v [ midpoint ]
10 else :
11 # i f even , r e t u r n t h e a v e r a g e o f t h e m i d d l e v a l u e s
12 lo = midpoint − 1
13 hi = midpoint
14 r e t u r n ( sorted_v [ l o ] + sorted_v [ h i ] ) / 2
Mode
1 d e f mode ( x ) :
2 """ r e t u r n s a l i s t , mi g h t be more t h a n one mode """
3 counts = Counter ( x )
4 max_count = max ( c o u n t s . v a l u e s ( ) )
5 r e t u r n [ x_i f o r x_i , c o u n t i n c o u n t s . i t e r i t e m s ( )
6 i f c o u n t == max_count ]
Nếu như giá trị của range bằng 0, thì tất cả các phần tử trong tập ban
đầu là bằng nhau.
Note dot: tổng của tích các thành phần tương ứng của các phần tử.
Correlation
1 def c o r r e l a t i o n (x , y ) :
2 stdev_x = s t a n d a r d _ d e v i a t i o n ( x )
3 stdev_y = s t a n d a r d _ d e v i a t i o n ( y )
4 i f s t d e v _ x > 0 and s t d e v _ y > 0 :
5 r e t u r n c o v a r i a n c e ( x , y ) / stdev_x / stdev_y
6 else :
7 r e t u r n 0 # i f no v a r i a t i o n , c o r r e l a t i o n i s z e r o
Ví dụ
Source: Internet
Nhận xét Một số tương quan bằng 0 thể hiện không có một quan hệ
tuyến tính nào giữa chúng. Tuy nhiên, có nhiều loại quan hệ.
Ví dụ. x = [−2, −1, 0, 1, 2] y = [2, 1, 0, 1, 2]
Khi đó correlation(x, y ) = 0, tuy nhiên, giữa x và y có quan hệ với nhau,
đó là yi = |xi |.
Việc correlation = 0 thể hiện không cho ta thông tin về mối quan hệ giữa
xi với mean(x) và giữa yi với mean(y )