You are on page 1of 16

影響 2018 spotify 歌曲排行因素

組員:
藍賀丞、呂淇、顏欣媛、鮑威宇、侯翊涵、李卓穎、黃嘉新
目錄
壹、研究背景 ............................................................................................................................2

一、目的與動機 ....................................................................................................................2

二、研究方法 .............................................................................................................. 2

貳、資料分析 ............................................................................................................................2

一、基本統計分析 ................................................................................................................2

二、相關性分析 ....................................................................................................................6

三、常見特點分析 ................................................................................................................9

四、重要變數分析 ..............................................................................................................10

五、歌詞分析 ......................................................................................................................11

1、綜合比較 ....................................................................................................................11

2、西文歌曲 ....................................................................................................................13

參、結論 ..................................................................................................................................15

1
壹、研究背景
一、 目的與動機
台灣的流行音樂始於翻唱日本、歐美歌曲,直至 1976 年「滾石」的創
立,掀起了台灣唱片界風起雲湧的一頁,然而隨著人們消費型態的改變,
從逛唱片行、到網上購買唱片、至今日盛行的音樂串流平台,隨著玫瑰唱
片、大眾唱片一間間的收掉,台灣唱片行的衰退也展現出了全球音樂產業
的線上化現象,而當音樂的銷售型態由一張張的唱片轉為串流平台上的單
首歌曲,為了追求更高的銷量,「歌曲本身」便成為比「藝人塑造」更為重
要的重點。
而在這樣一個大環境之下,什麼樣的因素又將主導著未來音樂發展的
道路?因此我們利用目前主流串流平台 Spotify 的 2018 年排行榜音樂進行
分析與比較,進而在目前逐漸衰弱的音樂市場上找尋出路,並期望同時能
給予各大音樂人們未來方向的參考資料。

二、研究方法
1. 使用來自 kaggle 網頁中的 Top Spotify Tracks of 2018 資料進行分析
(https://www.kaggle.com/nadintamer/top-spotify-tracks-of-2018),內
容使用 Spotify Web API 和 Spotipy Python 庫提取了每首歌曲的音頻
功能。
2. 使用 EDA、Correlation & density、Common Keys 分析、決策樹、文
字探勘等找出各變數對於排行榜的影響狀況。
3.

貳、資料分析
一、基本統計分析
首先我們對於資料進行 EDA,先整理出「最多次出現在 2018 排行榜的

2
歌手」,使用 group_by 和 summarize 計算每個歌手出現在排行榜的次數,並
只顯示超過 1 次的歌手。

由圖可知,XXXTENTACION 與 Post Malone 為出現最多次的歌手(6


次),緊接著是 Drake(4 次)。
接著為了找出「2018 排行榜上播放時間最久的歌手」,我們先定義播放時
間:
播放時間(Playing Time) = 串流次數(Streams) * 歌曲長度(Duration)

因此我們先單獨計算每一首歌的播放時間,再使用 group_by 和
summarize,計算每個歌手所有上榜歌曲的播放時間加總,並只顯示前 20 名歌
手。

3
由圖可知,最多次播放時間為 Post Malone,其次是 Drake。
有趣的是,根據 Spotify 官方公布,2018 全球最佳串流歌手為 Drake,因此
我們本來預期做出來的第一名會是 Drake,然而結果為 Post Malone,我們認為
是因為我們只計算了有上排行榜的歌曲的總播放時間,但若把其他沒上榜的歌
曲的播放時間也加入,則總播放時間或許會是 Drake 勝出。

而從前面分析出的上榜歌曲數量或是總歌曲流量來看,Post Malone 都是所


有歌手中最高的,把 2018 年稱之為 Post Malone 年一點也不為過 ! 於是我們打
算繼續深掘,看看 Post Malone 在 2018 年到底有多輝煌、在 2018 年發行的歌
曲在排榜上的表現又是如何。
我們從 Daily Stream 的資料中抓取 2018 每一天的 TOP 100,這樣許多在年
底推出的好歌,便不會發生因為發行時間較短而沒有擠進年度 TOP100 的遺
憾,對於 Post Malone 在 2018 的表現探討會更加全面。下圖為 Post Malone 在
2018 年歌曲有上 daily top100 的天數。

4
接下來我們把每一天的 Position 納入考量,再繪製出一張 2018 Post Malone
名次狀況!圖中我們可以發現 2018 年的前半年幾乎,Post Malone 的歌曲都能
維持在前 5 名。到了第三季比較沒有歌曲推出時名次才稍微往後退了一些,而
到第四季隨著蜘蛛人的電影推出,幾首膾炙人口的歌曲如 Sunflower 再次霸佔
了串流排行榜的榜首。

而後我們將各變數(x)分別與串流量(y)做散布圖,以觀察變數與串流
5
量是否有明顯的趨勢,以及排行榜歌曲的各變數分布狀況。例如:歌曲的
danceability 普遍高於 0.5;acousticness 超過 0.625 的歌曲串流量較低;歌曲的
長度主要集中在 200000 毫秒上下。

二、 相關性分析

為了了解每項歌曲旋律、歌的聲音大小、節奏等可以量化的資
訊,對於前一百名的歌的其他性質是否有影響,也就是 2 個變數實際
到底有沒有關聯,當某項變數高的同時也帶動另一項,例如是否出現
有 TEMPO 很快的歌就可能同時也很大聲之類的情形。
因此我們想比較相關性,藉此找出受歡迎的歌可能有的共同特
質,於是我們先將資料篩出數值型再進行分析,剔除前 3 個 ID、歌
名、歌手類別型資料,用 corrplot 方式呈現,呈現方式採用圓形較能
看清楚結果。

6
結果顯示,在正相關的資料類別之中,loudness 跟 energy 有最
高的正相關,而 valance 則跟 danceablility、energy 和 loudness 也有
不錯的正相關,其他變數就沒那麼強。負相關上只有 energy 和
acousticness 比較明顯,但也不強。
通常越有節奏的歌也比較大聲,小聲反而讓人覺得較靜態柔和,
因此這兩項有最高的正相關也很正常,也因此 energy 會跟
acousticness 表示負相關,後者代表歌曲所含的非電子音部分,但快
節奏的歌卻常跟電子樂器連結,才有較大的負相關程度。
解釋 valance 的話,代表歌曲帶給聽眾正向程度會跟
danceablility、energy 和 loudness 三個掛勾,推測原因可能是這類型
的歌通常讓氣氛較活絡,能帶動聽眾的情緒,也會讓他們比較開心。

7
從 PCA 的分析來看,其實也能發現類似的結果,PC1 的模型結
果較類似整體的相關性,而且能明顯的看出在 PC1、PC2 的圖中
energy 和 acousticnese 完全在反向,符合上面負相關的感覺。

接著我們從密度圖來檢查他們的相關性是否真是如此(因為
loudness 的資料尺度跟其他人不同因此我們要分開做,否則 X 軸會被
拉得太長)。

8
整體看來他們分布情形都很類似,在前一百名的歌大多數都是大聲
的,而且他們同時也較有節奏等特性,但是跟負相關的 acousticness
一畫出來就發現其實他是左偏的,也就是前一百名的歌較偏向有 0 的
非電子音,剛好也跟前面的結論相呼應。

三、常見特點分析
我們要探討前 100 名歌曲中,那些音調較常出現。為了方便呈
現,將 data 裡面的變數 key,改為以真正的音調英文字母表示,而非
數字。

9
由上圖可清楚看出,前 100 名歌曲中最常見的音調為 C♯,D♭,共出現
15 次;G♯,A♭次之共 11 次;而 A, B, C, D 分別皆以 10 次並列第三;最
後一名,也就是最少出現的音調為 D♯,E♭,僅 4 次。

結果有點出乎意料,因為第一名居然是 C♯,D♭這種聽起來較不會有
人用它來創作的曲調,且第二名的 G♯,A♭也很令人意外;反倒是一般大
家較認識的 A, B, C, D 這些傳統音調才並列第三。看來現今流行歌曲的
音調曲風和古典音樂相比,似乎有非常大的差異,因此推測與現代人
較喜歡求新求變,想脫離傳統努力創新的性格有關;而音樂創作人為
了迎合廣大的聽眾群,也會盡力配合寫出相符的音調曲風,以增加歌
曲上榜的機會。

四、重要變數分析
為了探討影響排名的重要變數,在資料內加入一項新變數
“standings”代表排名,並且利用監督式學習方法中的決策樹
(decision tree)來分析。

10
由上圖可清楚看到最左邊僅有一個分支,可見影響排名最重要的因素
是”liveness”,若其數值大於 0.33,也就是歌曲偏向 live 演出的話,有
極高機率成為排行榜的前幾名。但若 liveness 小於 0.33,就必須再依序檢
查其他變數的表現。
我們看樹圖的右半邊分支,liveness 小於 0.33、tempo 小於 163、
loudness 大於 -6.33、key 大於 7,且 valence 小於 0.6 的歌曲,依然有高
機率佔據排行前段班。換句話說,即使不是 live 演出的歌曲,但只要節奏
不是非常快、整體音量不要太小、音調屬於 G, G♯,A♭, A, A♯,B♭, B 之中,
且曲風是中庸偏負面情緒,仍然受到多數人歡迎。
相反的,如果歌曲 tempo 大於 163;或是雖然 tempo 小於 163,但
loudness 小於 -6.33 且 speechiness 小於 0.047,有極高可能位處排行榜
後段。也就是說,曲速過快,或音量過小且極度分辨不出歌詞意思的歌
曲,較不受人喜愛。

五、歌詞分析
此部分運用課堂中的教學,將每首歌的歌詞爬蟲後分別存入 excel 檔
案中,並用抓取.csv 檔案欄位資料的方式整理出以下的分析。

1、 綜合比較
1-1、 最常出現的字詞(Bar Chart、WordCloud)

11
Spotify 的 2018 前 100 名歌曲排行榜中,最常出現的字詞前五名為
like、yeah、 que、know 和 love,次數分別為 499、463、264、260、
254。以出現次出最多的 like 而言,幾乎超過 3/4 的歌曲都有這個單字。

1-2、 情緒分析
Negative 的字詞判斷有 191 個,Positive 則有 95 個。其中出現的字詞由
下圖
WordCloud 表示。

12
1-3、 歌詞字詞的相關性
使用 Clustering 將 100 首歌的歌詞分群。舉例而言:同類字義出現的關聯
性(bitch, fuck,etc.)、動名詞出現的關聯性(ex.call,name)。

1-4、 100 首歌之間的分群關聯性


將 100 首歌做分群,找尋歌曲之間的關聯性。舉例而言:語言的關聯性
(ex.23、44 同為西文歌曲)、歌手關聯性(18、67 同為 Ariana Grande 的歌
曲)

13
2、 西文歌曲
由於整體資料的歌詞文字雲中,發現有西班牙文”que(甚
麼)",且是出現頻率第三高的單詞,顯示了西文歌在這 100 首熱門
歌曲中佔有一席之地,因此我們將西文歌曲進行獨立分析。
其中最常出現的字詞(Bar Chart、WordCloud)部分,從這
15 首排行榜前段班的西文歌中,出現最多次的字彙 Como,和英文
歌最常見的字 like 意思相近。其餘常見的字詞中, taki(親吻的聲
音、暗指身體部位)、quier(想要)、gusta(使愉悅),我們可以窺
見熱門西文歌曲歌詞風格的奔放熱情。

14
參、結論
從以上分析我們可得到對於影響 spotify 歌曲排行因素之中
1、 較屬舞動類(Danceability)
2、 音調偏 C♯,D♭,跳脫古典曲調
3、 偏向 live 演出且較少電子音
4、 大聲有活力,但節奏不會太快
5、 歌詞多為負面情緒,且關乎情愛
這五項將構成得以上排行榜音樂的主要條件,分析結果能給予主流音
樂人創作的方向,若是希望能在 spotify 這種音樂串流平台上取得好成績的
音樂製作人便能朝這個方向做調整。
然而在我們分析歌詞部份時也出現西文歌曲以奔放熱情的內容為主這
個不同於其他歌曲的現象,因此在這個分析資料中我們認為這個結果是針
對大方向、全球性的進行分析,也就是說是以英文歌曲為主,但對於不同
語言的歌曲人們可能有著不同的偏好結果,這也是未來可以再進行更深入
研究的部份。

15

You might also like