首頁>娛樂>

今年賀歲檔上映了眾多電影,其中有喜劇片代表唐探3、你好,李煥英,奇幻冒險片代表刺殺小說家、侍神令,犯罪片人潮洶湧等,眾多電影中,我最喜歡看唐探3,因為之前看過唐探1和2系列,再加之本該去年上映的電影,延期一年才上映,心中多了一些期許。

豆瓣熱映影評截圖

從最新的豆瓣影評來看,唐探3豆瓣評分5.8,其中,44.7%的人評了3星,對此作者想分析春節檔其他電影的評分情況,本節透過SQL建立庫,並新建一個film表,用於儲存電影影評資料,分析春節檔電影的評分情況。

唐探3豆瓣評分截圖

建立庫

首先是在My SQL中建立一個庫,取名叫做film,關於建立庫有兩種方法,一種方法是使用SQL語句建立庫,另一種是藉助Navicat Premium 12工具建立庫。

使用SQL語言建立一個名字叫film的庫。

# 新建資料庫CREATE DATABASE film;

另一種建立資料庫的方式,滑鼠右鍵選擇新建資料庫,填寫資料庫名,重新整理一下,即可看到左側建立的資料庫。

因為My SQL中有很多的庫,在建立庫後,需要指定接下來需要操作的資料庫。

# 指定接下來需要操作的資料庫USE film;
建立表

建立表,相當於建立一個只有標題而沒有具體數值的表格,這裡表格所包含的列標題分別代表電影名稱,上映時間,上映國家、導演、電影型別、評分、評分人數、電影時長。

# 構建用於儲存電影的空表CREATE TABLE newfilm(name VARCHAR(50),uptime YEAR,country VARCHAR(20),director VARCHAR(30),type SET('喜劇','懸疑','動作','奇幻','冒險','犯罪','動畫'),score DECIMAL(2,1),Num_Commentaries INT,costtime INT);

建立空表格後,需要給這張表格中插入資料,包括電影名稱,上映時間,上映國家、導演、電影型別、評分、評分人數、電影時長,需要注意,SQL語句中的所有標點符號需在英文輸入法下輸入,且漢字需用單引號括起來。

# 插入表格資料INSERT INTO newfilm(name,uptime,country,director,type,score,Num_Commentaries,costtime) VALUES('唐人街探案3',2021,'中國大陸','陳思誠','喜劇,懸疑',5.8,380485,136),('你好,李煥英',2021,'中國大陸','賈玲','喜劇',8.3,205475,128),('刺殺小說家',2021,'中國大陸','路陽','動作,奇幻,冒險',7.1,118028,130),('人潮洶湧',2021,'中國大陸','饒曉志','喜劇,犯罪',7.3,37235,119),('侍神令',2021,'中國大陸','李蔚然','奇幻',6.1,39248,120),('新神榜:哪吒重生',2021,'中國大陸','趙霽','動作,動畫,冒險',7.4,24002,116),('熊出沒·狂野大陸',2020,'中國大陸','丁亮,邵和麒','喜劇,動畫',6.8,5944,99),('心靈奇旅 Soul',2020,'美國','彼特·道格特,凱普·鮑爾斯','動畫,奇幻',8.9,580519,101),('拆彈專家2',2020,'中國大陸','邱禮濤','動作,犯罪',7.9,320996,121),('瘋狂原始人2',2020,'美國','喬爾·克勞福德','喜劇,動畫,冒險',8.0,149123,95),('海底小縱隊:火焰之環',2021,'中國大陸,英國','布萊爾·西蒙斯,周沁','動畫,奇幻,冒險',7.0,1555,80);

插入資料僅用了0.007秒的時間。

將資料填充到表中後,預覽資料表前五行資料,使用LIMIT語句,LIMIT5表示顯示前5行的資料內容。

# 檢視前五行資料表內容SELECT * FROM newfilmLIMIT 5;

預覽前五行資料如下所示。

資料分析

選取2021年上映評分最高的前五個電影,SELECT選擇電影名稱和電影評分欄位,WHERE用於篩選上映時間為2021年,GROUP BY按照電影名稱分組統計, ORDER BY 按照電影評分高低降序排列。

#選取2021年上映評分最高的前五個電影SELECT name,score from newfilmWHERE uptime='2021'GROUP BY nameORDER BY score DESCLIMIT 5;

從分析結果可以看出,你好,李煥英豆瓣評分為8.3,評分最高。

選取2021年評分人數最多的前五個電影,按照電影評分人數降序排列。

#選取2021年評分人數最多的前五個電影SELECT name,Num_Commentaries,score from newfilmWHERE uptime='2021'GROUP BY nameORDER BY Num_Commentaries DESCLIMIT 5;

從分析結果來看,唐探3有近40萬的影評人數,影評人數最多,但是豆瓣的評分只有5.8,實在是有點惋惜。

選取2021年上映電影時長最長的前五個電影,按照電影時長降序排列。

#選取2021年上映電影時長最長的前五個電影SELECT name,costtime from newfilmWHERE uptime='2021'GROUP BY nameORDER BY costtime DESCLIMIT 5;

從分析結果來看,唐探3電影時長136分鐘,在所有上映的電影中,播放時長最長,所以說,還沒看唐探3的朋友,是否考慮,一桶爆米花不夠呢?電影時長太長,要準備兩桶才夠,哈哈哈。

除此之外,今年還有兩部網劇的上映,分別是宋小寶導演的"發財日記",還有王寶強主演的"少林寺之得寶傳奇"。

在此例中,往表中插入新的豆瓣影評,同樣使用INSERT INTO的方法,插入需要欄位的數值內容即可。

# 往表中插入新的豆瓣影評INSERT INTO newfilm(name,uptime,score,Num_Commentaries,costtime) VALUES('發財日記','2021','6.1',13267,128),('少林寺之得寶傳奇','2021','4.3',3492,93);

檢視新增資料表內容,使用WHERE語句進行篩選,將名稱中帶有'發財日記'和'少林寺之得寶傳奇'的電影名稱單獨篩選出來。

# 檢視新增資料表內容SELECT * FROM newfilmWHERE name in ('發財日記','少林寺之得寶傳奇');

篩選出來的資料結果如下所示。

4
最新評論
  • 《大奉打更人》結局: 許七安的最終歸宿
  • 周杰倫《不能說的秘密》韓版,EXO都暻秀出演,女主還未選出