Professional Documents
Culture Documents
Python 程式設計與應用
期末專題報告
台中市西屯區房價探討
Discussion on Housing Prices in Xitun District,
Taichung City
指導老師:黃鈺茗
施昱安 D0860604
蔡佩宏 D0980664
高婕妤 D0855326
江曜廷 D0843365
謝秉諺 D0885978
中 華 民 國 一 百 一 十 二 年 五 月
台中市西屯區捷運線房價探討
摘 要
而位於台中西屯區的台中市政府,是有很多公務人員聚集上班
的地方,附近商圈也很發達,還有很多政府相關手續或辦事處都會
在附近聚集。因此本次研究將以台中市政府遷移前後周遭房價探討
為例,希望透過 Python 進行大數據分析與資料探勘,來分析是否真
的會帶來影響,並探討其原因。
關鍵詞:大數據分析、資料探勘、房價
Abstract
In 2020, the epidemic ravaged the world and affected the economies
of various places. However, according to reports, the housing market in
Taichung has grown in reverse, and a lot of investment hot money has
poured in. There is data in the real-price registration data that shows that
in 0-5 years old newly built houses In terms of case increase, Taichung
City is the first, Tainan City is the second, and Hsinchu County is the
third. It can be seen that the top three cities with the highest house price
growth are all places that focus on developing science parks. It can be
seen that job opportunities and salary levels will directly affect house
prices.
目 錄
第一章 緒論..................................................................................................................6
1.1 研究動機與背景..................................................................................................6
1.2 研究架構............................................................................................................10
第二章 文獻探討........................................................................................................11
2.1 住宅屬性與房價關係之研究............................................................................11
第三章 研究設計與實施............................................................................................12
3.1 研究方法與步驟................................................................................................12
第四章 實驗結果與分析............................................................................................17
4.1 研究分析............................................................................................................17
4.2 捷運線深度探討................................................................................................24
第五章 結論與心得....................................................................................................29
第六章 附錄................................................................................................................33
6.1 參考文獻............................................................................................................33
6.2 原始數據表........................................................................................................33
圖 目 錄
圖 1 研究架構圖.........................................................................................................11
圖 2 內政部不動產交易時價查詢服務網.................................................................13
圖 3 找尋 URL............................................................................................................13
圖 4 爬取資料的回傳值.............................................................................................15
圖 6 交易資料詳細內容.............................................................................................16
圖 7 熱力圖.................................................................................................................19
圖 8 房屋總價分佈圖.................................................................................................20
圖 9 面積與屋價關係圖.............................................................................................21
圖 10 不同變數與屋價關係圖...................................................................................22
圖 11 台中市西屯區前十名交易量路段圖...............................................................23
圖 12 台中市西屯區前十名交易量路段平均房價圖...............................................24
圖 13 西屯區捷運路線圖...........................................................................................27
圖 14 綜合歷年捷運站附近道路平均房價圖...........................................................29
表目錄
表 1 台中市各地區的人口數及佔總台中人口比例表...............................................7
表 2 西屯區捷運路線周圍房價分析圖.....................................................................27
第一章 緒論
1.1 研究動機與背景
本研究會選擇在西屯區的動機,主要是出自於以下幾項原因:
根據本組目前觀察下來,不管是逢甲大學擴大校區又或者是中國醫
藥大學設立分校,都可以看到前身為機場的中央公園,已經慢慢地
有在進行建設的趨勢。
根據台中市政府民政局人口管理統計平台得知(表 1),我們
可以得知人口數前三名,依序分別是北屯區、西屯區、大里區,對
應區人數為 290,371、229,469、211,176。由此可知道西屯區人數佔
全台中的 8.2%位居第二,相較於台中其他區域,對於想要租給其他
人的房東或者想要依靠買賣房來賺差價的人來說,具有一定的投資
市場價值。
表 1 台中市各地區的人口數及佔總台中人口比例表
地區 人口數 佔全台中總人口比例
北區 142,197 0.0507971
中區 17,457 0.0062362
西區 111,812 0.0399427
東區 75,196 0.0268623
南區 125,044 0.0446695
總和 2,799,312 0.99899905
綜上所述,本研究之研究目的主要針對西屯區近年的房價進行
分析,期望能透過數據圖像化的方式,分析出西屯區不同類型的房
子,其值得投資的區域分別散佈在哪些地方,以提供日後投資西屯
房屋參考。
1.2 研究架構
圖 1 研究架構圖
第二章 文獻探討
2.1 住宅屬性與房價關係之研究
本研究係為在西屯區中住宅類型與房價兩者關係之研究,因此
先針對過去內外有關於住宅屬性之相關文獻作探討。房屋屬性中的
距市中心之遠近,在劉秀玲(1992)、林建亨(2008)、章耀玲(1998)、
林國民(1996)之研究中均證實,距市中心之遠近對房價均有顯著之影
響,而上述研究地區均有一共同特性,均位於都會地區或是屬於人
口較為集中地區,顯示距市中心之遠近對於非都會區之房價較無顯
著之影響關係,而建物使用類型在 Mark and Goldberg(1986)、劉秀
玲 (1992) 、 林 建 亨 (2008) 、蔡 育政 (2009) 、紀侑 廷(2014) 、林國民
(1996)之研究中證實,影響房價重要房屋屬性為建物使用類別,以台
灣大樓建築規劃,大樓一樓通常多可作為店鋪使用具有商業效益,
可從事營業或是商業活動使用,而樓上層亦可能僅供住家使用,較
難有其他營業或是商業活動使用,因此具有營業或是商業活動使用
之房價,會高於一般住家使用亦屬必然之情況,顯示建物使用類別
對於房價有顯著之影響。
第三章 研究設計與實施
3.1 研究方法與步驟
一、 爬取內政部實價登錄房價資訊資料進行預處理
搜尋台中市西屯區 101 年至 111 年不動產交易資料。
圖 2 內政部不動產交易時價查詢服務網
圖 3 找尋 URL
import pandas as pd
import json
url='https://lvr.land.moi.gov.tw/SERVICE/QueryPrice/
f64c314404288abb749efd281ac96319?
q=VTJGc2RHVmtYMS94NTAvd01XMytabmJWQ2c4QzJTWXBWZkZpZWhoRkw
5MkR4NnJhT1FZSEl6WjJPQ3U3Zmo1WkI1bkNVWGJ0SjBxNEo4VDhYOVJhOV
pxbllKZTRCNkpFTVVmSG1aUHpFc2pjd1hPdFBCMUdxOXB1VXNIQVE2d2hvd
URGUWFwOHNzSThOcWMzNW9ZaDZUdWkrL2F0UnhrZEd4aG9udVU4V25Cb
kRabTJpdFZ4NzRVZXNKaXVkVW5JYXlxNCtIcndhN0dSeFZQQnhRZjVqYjUwd
k1nQVJ1Q2E1c2lha0Q1VTA2dGVwNmlkRHduTWdOTi9EbGVlVHJmU1JXdXp6a
ExJMVYxMGhWNHBLV0d0U3dXNHRzT0lmZXR2Ty9CRGdGNm5panRhcTAwM
FdTd2laamNEbEZLZjBwYTI4OXhZY1VnMk41bXExazR3TkdOc2lGaVA0NDVlR
TlMNmlhaGo1QTArUVJ1NVMvUEs3VlJMSDZqYzJ6VEduNkVmYnVNSVVxb2R
ocHRkWkwxMEQ4MDZvNWlJM0crclVRL0w2ZzBqbHhpd0duRWwxWHl6SUMz
dWh6NmVKRkNQbW1jaDl1UVcrWTluUmZqaGxDaC9UTkVaVmZwQW45N3JH
RFBrSGZVODlXSm9yLzRLNE1Ed25NdENDaWZZMXNlNUZHdUFzbHJEaFc2a2
dTWlZRSHRhNHFvTldKaUJGVU9LM3diM3NuOWJ1QnpWbTFHYjcyZk1lMWV
KdExUa3dCRTNGYkJOOW16Wkp4NkFXaVNSV0Fab0VCakFXSFFlL3BkUEoxc
GFGVHB0QnUwSzNUSkVqNDhmeENNdm9DeVlER2EwSlhpN2JTVHpOd1lCMjc
vSHEwVzdTQVc2SU03ZU1qNTFmZ253LzkyVi8zME9EcjA5REY3b0JEM1IvZFo0
cnhiUm9PbFY'
resp=req.get(url)
resp.raise_for_status()
print(err)
圖 4 爬取資料的回傳值
圖 5 資料轉為 JOSN 格式
圖 6 交易資料詳細內容
'parking_space','elevator','manager','mb_share','floor','building_type','house_a
ge','layout'])
total_data=len(data)
for i in range(total_data):
addr=data[i]['a']
total_price=data[i]['tp']
unit_price=data[i]['p']
area=data[i]['s']
parking_space=data[i]['cp']
elevator=data[i]['el']
manager=data[i]['m']
if data[i]['es']=='':
mb_share=data[i]['bs']
else:
mb_share=data[i]['es']
floor=data[i]['f']
building_type=data[i]['b']
house_age=data[i]['g']
layout=data[i]['v']
new_row =
{'addr':addr,'total_price':total_price,'unit_price':unit_price,'area':area,'park
ing_space':parking_space,'elevator':elevator,'manager':manager,'mb_share
':mb_share,'floor':floor,'building_type':building_type,'house_age':house_a
ge,'layout':layout}
df_house = df_house.append(new_row,ignore_index=True)
columns=['addr','total_price','unit_price','area','parking_space',
'elevator', 'manager','mb_share','floor','building_type',
'house_age','layout'], index=False)
第四章 實驗結果與分析
4.1 研究分析
檢查資料集中有哪些「建築物類型」,本研究只留下三種建築
物類型,分別為住宅大樓、公寓及華廈,剔除其他,例如:透天厝、
辦公商業大樓、店面(店舖) 、其他、工廠、廠辦、農舍、倉庫,將
資料整理乾淨後,再做進一步的分析。
一、 資料前處理
(1) 檢查資料集中有那些「建築物類型」。
all_type = df['building_type'].unique()
(2) 留下住宅大樓、公寓及華廈建築物類型。
df=df[df['building_type'].str.contains('住宅大樓') |
df['building_type'].str.contains('公寓') |
df['building_type'].str.contains('華廈') ]
df=pd.concat((df,dummy),axis=1)
(4) 重新命名欄位
df=df.rename(columns={'住宅大樓':'b_type1', '公寓':'b_type2','華
廈':'b_type3'})
(5) 取出所需欄位,並重新安排順序,獲得乾淨資料。
new_cols = ['addr1','area','house_age', 'room','dining','bath',
'elevator','manager', 'which_floor','total_floor',
'building_type','b_type1','b_type2','b_type3','total_price','transaction_date']
df_clean=df[new_cols]
二、 圖畫分析
(1) 熱力圖
利用相關矩陣,檢視各欄位之間的相關性,並以不同顏色
表示數值大小的差異狀況。
import seaborn as sns
df_temp=df_clean.iloc[:,1:13]
fig, ax = plt.subplots(figsize=(12,10))
ax = sns.heatmap(df_temp.corr(), annot=True)
label_x = ax.get_xticklabels()
plt.show()
圖 7 熱力圖
(2) 房屋總價分佈
根據十年的房價資料,可繪製出房屋總價分佈圖,如下圖
所示,台中西屯區五百萬至一千萬元區間的交易比數量最
多。
s_price_avg=df_clean.groupby('building_type')['total_price'].mean()
plt.figure(figsize=(10,6))
plt.hist(df_clean.total_price,
bins=[500,1000,1500,2000,2500,3000],edgecolor='k')
plt.ylabel('Counts')
plt.show()
圖 8 房屋總價分佈圖
(3) 面積與屋價關係圖
進一步分析面積與屋價關係,如下圖所示,房屋價格與建
物面積呈正相關。
plt.figure(figsize=(10,6))
plt.scatter(df_clean.b_type3, df_clean.total_price)
plt.show()
圖 9 面積與屋價關係圖
(4) 一次性比較不同變數與屋價關係圖
根據不同特徵分析與房價的關係,本研究所取特徵值包括
面積、屋齡、層樓、總樓數再與總價做分析。
cols=['area','house_age','which_floor','total_floor','total_price']
df_temp=df_clean[cols]
sns.pairplot(df_temp)
圖 10 不同變數與屋價關係圖
(5) 台中市西屯區前十名交易量路段圖
如下圖所示,國安一路建物的交易筆數最多,其次為西屯
路。
stree_count = df_clean.value_counts('stree')
top10 = [2225,1672,934,801,666,650,607,578,535,484]
plt.xticks(top10_stree, FontProperties=myfont)
plt.title('台中市西屯區前 10 名交易量路段',FontProperties=myfont)
plt.xlabel('stree')
plt.ylabel('Counts')
ax.annotate(txt, (top10_stree[i],top10[i]))
plt.show()
圖 11 台中市西屯區前十名交易量路段圖
(6) 台中市西屯區前十名交易量路段平均房價圖
top10_price = []
for i in top10_stree:
df_temp=df_clean[df_clean.stree.str.contains(i)]
s_avg_price=df_temp['total_price'].mean()
top10_price.append(round(s_avg_price))
print(top10_price)
plt.xticks(top10_stree, FontProperties=myfont)
plt.title('台中市西屯區前 10 名交易量路段平均房
價',FontProperties=myfont)
plt.xlabel('stree')
plt.ylabel('price')
ax.annotate(txt, (top10_stree[i],top10_price[i]))
plt.show()
圖 12 台中市西屯區前十名交易量路段平均房價圖
4.2 捷運線深度探討
一、 西屯區捷運路線圖製作
為了分析台中捷運站與西屯區房價的關係,利用 folium 套件實
踐地圖視覺化,以利觀察捷運站周圍道路名稱。
import folium # 視覺化
import networkx as nx
import numpy as np
import pandas as pd
add_w="文心路三段"
add_e="易遊網"
loc_w = geocoder.geocode(add_w)
loc_e = geocoder.geocode(add_e)
dist_w_e=ox.distance.great_circle_vec(coord_w[0],coord_w[1],
coord_e[0],coord_e[1])
df= pd.DataFrame({'address':[add_w,add_e]})
calculator')
m = ox.graph_from_point(coord_w,dist = 10000)
m = ox.speed.add_edge_speeds(m)
m = ox.speed.add_edge_travel_times(m)
orig=ox.distance.nearest_nodes(m,
df.loc[0,'geometry'].x,
df.loc[0,'geometry'].y,
return_dist=False)
dest=ox.distance.nearest_nodes(m,
df.loc[1,'geometry'].x,
df.loc[1,'geometry'].y,
return_dist=False)
route_map=ox.plot_route_folium(m,route)
route_map
圖 13 西屯區捷運路線圖
二、 西屯區捷運路線周圍房價分析圖
本研究列出捷運站附近道路後,製作出各道路歷年房價趨勢圖 ,
並整理成表格,方便進一步分析。
表 2 西屯區捷運路線周圍房價分析圖
從以上這些圖,我們可以從趨勢線看出大部分捷運旁的房價皆
有上升的趨勢,只有少數地段房價趨勢略為下降,而主要在市政府
旁的地段,如市政路、市政北一路、市政北三路、市政北五路、市
政北六路及市政北七路等,房價更是令人卻步,平均皆有兩千萬以
上,可推測市政機關對於房價確實具有影響。
圖 14 綜合歷年捷運站附近道路平均房價圖
由合計歷年捷運附近路段平均房價可以得知,房價逐漸攀升,
從
101 年平均房價為 800 萬,到近兩年來高達 1200 萬,可推測除了近
年來房價高漲之外,捷運也確實影響到了附近的房價,便利的交通
會驅使投資客往這部分的房子進行購買,不論是自住或是租給別人
都是一大優勢。
第五章 結論與心得
之前大一的時候,系上老師也有教過 Python,經過這堂課我更
熟悉的 Python 的基礎應用和資料處理的部分。也因為這學期有上何
思賢老師的 Python 課程,心理壓力上可能大了些。但是因為有這堂
課奠定我的基礎,讓我在 Python 的所有課程得心應手。
本身工工系加上有雙主資工,所以在程式方面比較拿手,上這
堂課時也學習到許多 python 相關的套件,經過這次的專題也能學以
致用,掌握更多技巧以便日後繼續增進自己能力。
起初,學習一門新的程式語言對我來說是一個挑戰。然而,透
過老師和助教的教學及幫忙,並透過深入淺出的解釋,我很快就找
到了入門的方法和理解的關鍵。老師的教學方式不僅給予了我學習
的動力,同時也培養了我對於程式設計的興趣和激情。這一段時間
的學習讓我相信自己可以克服困難,並且不斷進步。
在學習 Python 的過程中,我發現這門語言的優勢和多功能性。從基
本的語法到進階的應用,Python 的簡潔和直觀的語法讓我能夠快速
理解並且撰寫有效的程式碼。我學到了如何使用條件語句和迴圈來
控制程式流程,以及如何使用函式和類別來組織和重複使用程式碼。
Python 豐富的函式庫和第三方模組也為我解決問題和實現複雜功能
提供了許多便利。
除了程式語言本身,學習 Python 還教會了我許多其他重要的技能和
價值觀。透過實踐和專案作業,我學會了如何以系統性的方式解決
問題,從分析和設計到實現和測試。我體會到了團隊合作的重要性,
並學習如何與他人協作,在解決難題時發揮彼此的優勢。這些技能
和價值觀對於我未來的學習和職業生涯都具有重要意義。
最後,我要再次向您表達我對您的感謝之情。感謝您不斷鼓勵和引
導我,給予我信心和支持。
貢獻程度一樣
第六章 附錄
6.1 參考文獻
1. 廖銘祥, (2016).住宅屬性與房價關係之研究-以台中市北屯區為例
6.2 原始數據表