You are on page 1of 5

您是否经常想要了解一部电影的剧情,但又不想花费太多时间去看预告片或是阅读

评论?那么您来对地方了!HelpWriting.net提供了最全面的电影简介数据库,让您轻松
了解每部电影的故事。
我们的数据库包含了各种类型的电影,从经典的老电影到最新的大片,都能找到详细
的剧情介绍。
不仅如此,我们还为您提供了电影的评分和评论,让您可以更全面地了解每部电影
的质量。
想要使用我们的电影简介数据库,您只需要在HelpWriting.net上进行简单的搜索,即可
找到您想要了解的电影。而且,我们的网站界面简洁易用,让您轻松浏览和比较不同
电影的简介。
更重要的是,我们的数据库是由专业的作者团队精心编辑和更新,保证每部电影的
简介都是准确、详细和有趣的。
如果您是一位电影爱好者,那么HelpWriting.net的电影简介数据库绝对是您不可错过的
资源。立即访问我们的网站,开始探索各种电影的精彩故事吧!
记得收藏我们的网站,以便随时查阅电影简介和评论。也欢迎与您的朋友分享我们
的网站,让更多人可以受益于我们提供的电影资讯和服务。
谢谢您选择HelpWriting.net,希望我们的电影简介数据库能为您带来更多的电影乐趣!
祝您观影愉快!
HelpWriting.net团队

点击这里开始使用我们的电影简介数据库!
# 分析结论:从图中观察到,随着时间的推移,所有电影类型都呈现出增长趋势,尤其
是1992年以后各个类型的电影均增长迅速,其中Drama(戏剧)和Comedy(喜剧)增长最快,
目前仍是最热门的电影类型。 label_color = [label_color_map[i] for i in X_clustered] 1.原创和
改编电影中改编电影的收益一般要比原创的要高,估计有很多原著粉来看改编的电影
import matplotlib.pyplot as plt 本案例来源于kaggle上的TMDB 5000 Movie Dataset数据集,为
了探讨电影数据可视化,为电影的制作提供数据支持,主要研究以下几个问题:
df=pd.merge(movies,credit,left_on='id',right_on='movie_id',how='inner') Horror 440
plt.legend(genresdf) json_columns = ['cast', 'crew'] budget_genre 本数据集主要展示了美国在
大约100年间的4803部电影,并给出了电影的详细描述 ax1.set_title('原创电影和改编电
影的平均收益对比',fontsize=18) columns = range(1988,2018) cmap = sns.cubehelix_palette(start
= 1.5, rot = 1.5, as_cmap = True) 热图还显示,2013年西方电影的预算非常高。
novel_df=pd.concat([novel_df,df[columns_2]],axis=1) 我们创建了一个新的数据框架,包含
每个类型和计算出的平均值。 饼图流派饼图显示电影数据集中哪些流派最常见。
import warnings # 建立genres列表,提取电影的类型 # 电影时长与评分的关
系 f,ax=plt.subplots(figsize=(16,9)) for i in df['genres']: release_date 4802 non-null object
plt.savefig(r'e:python\movie\原创与改编电影',dpi=200) 为分析流派,colomns
标题,vote_average,release_data,运行时,预算,收入是最重要的。# In[62]: # ## 问题四:
改编电影和原创电影的对比情况如何? # In[52]: kmeans = KMeans(n_clusters = 3)
fig=plt.figure(figsize=(12,8))
df=pd.merge(movies,credit,left_on='id',right_on='movie_id',how='inner') # # 1.提出问题 for i in
genres.columns: vote_avg_genre.loc[liste_genres.index(genre)]=temp for genre in liste_genres:
companydf.index = moviesdf['year'] moviesdf['production_companies'] =
moviesdf['production_companies'].apply(decode) plt.plot(companydf,label=companydf.columns) #
## 问题三:Universal Pictures和Paramount Pictures两家影视公司的电影发行对比情况如
何? ''' 我们想分析每年类型的平均数。因此,我们首先扩展数据框。 set_1.remove(3) #逆
向获取数字列 #建立是否含有该风格的表格 Adventure(冒险类) 第二名 ax.set_xlabel('mean
of budget',fontsize='16') # **release_date列数据处理** moviesdf.info() moviesdf =
fulldf[['original_title','crew','release_date','genres','keywords','production_companies',
genresdfSum import numpy as np 有趣的是,动画,冒险和科幻类型的平均预算最高。
list.append(i['name']) #from sklearn.decomposition import PCA # 主成分分析模块 import seaborn
as sns ''' from scipy.misc import imread
temp=(df_per_genre[liste_genres.index(genre)].pivot_table(index = genre, columns = 'release_year',
values = 'revenue', aggfunc = np.mean)) #绘图 moviesdf['keywords'] =
moviesdf['keywords'].apply(json.loads) # * **分析电影关键字** # 动画,冒险和科幻类型的
平均收入最高。 # 把字符串列表连接成一个长字符串 mean_genre_profit.head() ''' #
**genres列数据处理** moviesdf['production_companies'] =
moviesdf['production_companies'].apply(json.loads) import seaborn as sns # 使用Seaborn库 pca =
PCA(n_components = 7) Universal Pictures(环球影业)和Paramount Pictures(派拉蒙影业)是美
国两家电影巨头公司。 for genre in liste_genres: # In[48]: from sklearn.cluster import KMeans #
K-均值应用聚类分析 '''
return "|".join(list) # * **分析电影关键字** moviesdf.head()
genres_b_s[i]=genres_budget.groupby(i)['budget'].mean()[1] warnings.filterwarnings('ignore') # 忽
略python运行过程中的警告错误 for i in x: mean_per_genre['mean_revenue'].plot.barh()
genresdf.tail() temp=(df_per_genre[liste_genres.index(genre)].pivot_table(index = genre, columns =
'release_year', values = 'budget', aggfunc = np.mean)) budget:预算(美元)
ax1.set_xlabel('genres',fontsize=16) #绘图 df.info()#查看合并后的数据结构 ax.set_title('mean
of vote_average by genres',fontsize=24) keywords_list.append(i)
moviesdf['if_original'].value_counts() # 数据可视化 id 4803 non-null int64 list=[] Universal
Pictures(环球影业) 和Paramount Pictures(派拉蒙影业) 是美国两家电影巨头公司。 df =
pd.concat([movies, credits], axis=1)#合并两个文件 -----------------------------------------------------------
----------------------------------- movies = pd.read_csv('F:/movies data/tmdb-5000-movie-dataset
/tmdb_5000_movies.csv') ''' list.append(i['name']) plt.title('Universal Pictures和Paramount Pictures
两家公司电影发行数量对比',fontsize=13)

You might also like