导演
徐克 主演 吴京 / 易烊千玺 / 中国大陆 / 中国香港 / 7.2分(286069评价) 电影以抗美援朝战争第二次战役中的长津湖战役为背景,讲述了在结束了新兴里和下碣隅里的战斗之后,七连战士们又接到了更艰巨的任务…… 注释:简介那里有两次换行,多了两个换行符\n 脚本内容: #coding=utf-8 import re import urllib.request def func1(): #获取电影《长津湖之水门桥》的网页源代码和内容 headers = { 'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201Firefox/3.5.6' } url_1 = 'https://movie.douban.com/subject/35613853/?tag=%E7%83%AD%E9%97%A8&from=gaia_video' #电影《长津湖之水门桥》的URL ret = urllib.request.Request(url_1,headers = headers) response = urllib.request.urlopen(ret) Key_1 = response.read().decode("utf-8") Path_1 = "./3.txt" f_name = open(Path_1,'w',encoding='utf-8') #写入(覆盖)文件内容 Result_1 = f_name.write(Key_1) f_name.close() func2() def func2(): #从文件中读取数据 Path_1 = "./3.txt" f_name = open(Path_1,'r',encoding='utf-8') fields_1 = f_name.read() #输出文件全部内容 f_name.close() func3(fields_1) func4(fields_1) func5(fields_1) def func3(fields_1): #输出电影名称 Result_1 = re.compile(u'(.*?)的剧情简介.*?') Result_2 = Result_1.findall(fields_1) print("电影名称:",Result_2[0]) Result_3 = f"{Result_2[0]}\n" Path_1 = "./4.txt" f_name = open(Path_1,'a',encoding='utf-8') #写入(追加)文件内容 Result_1 = f_name.write(Result_3) f_name.close() def func4(fields_1): #输出导演、主演、产地、豆瓣评分 Result_1 = re.compile(u'.*?导演
(.*?).*?') Result_2 = Result_1.findall(fields_1) print(f"导演、主演、产地、豆瓣评分:导演{Result_2[0]}") Result_3 = f"导演{Result_2[0]}\n" Path_1 = "./4.txt" f_name = open(Path_1,'a',encoding='utf-8') #写入(追加)文件内容 Result_1 = f_name.write(Result_3) f_name.close() def func5(fields_1): #输出电影简介 Result_1 = re.compile(u'\n导演
黄明升 主演 任贤齐 / 任达华 / 中国大陆 / 中国香港 / 5.3分(12775评价) 1997年回归前夕,多方势力矛盾激化,暴力事件频发。导演
(.*?).*?') Result_2 = Result_1.findall(fields_1) print(f"导演、主演、产地、豆瓣评分:导演{Result_2[0]}") Result_3 = f"导演、主演、产地、豆瓣评分:导演{Result_2[0]}\n" Path_1 = "./6.txt" f_name = open(Path_1,'a',encoding='utf-8') #写入(追加)文件内容 Result_1 = f_name.write(Result_3) f_name.close() def func5(fields_1): #输出电影简介 Result_1 = re.compile(u're.S) # re.S 包括换行符\n在内的任意字符;换行符\n可以不写 Result_2 = Result_1.findall(fields_1) Result_3 = Result_2[0].strip() #去除左边和右边的空格、换行符 a = Result_3.split('欢迎光临 blog.zhuohua.store (http://blog.zhuohua.store/) | Powered by Discuz! 7.2 |