当前位置:首页 » 观影平台 » 爬取豆瓣电影的图片
扩展阅读
日本高系电影 2024-04-27 17:00:06
介绍点中国好看的电影 2024-04-27 16:55:23

爬取豆瓣电影的图片

发布时间: 2024-03-29 13:50:35

豆瓣电影上的海报图片可以复制保存吗怎么复制

电影上面的海报图片是可以复制保存的,但是有的话是没有这个权限的,你要进行截图。

❷ 豆瓣电影API,包括豆瓣电影搜索、电影信息、评论、Top250等

全部数据均来自豆瓣且以 Json 格式返回

简介:使用 (GET) 方法对基于影片名称模糊查询对应匹配的影片

https://api.xhboke.com/movie/search?s=肖申克的救赎&page=0

简介:使用 (GET) 方法通过豆瓣影片唯一标识 id 获取影片相关信息。

https://api.xhboke.com/movie/info?id=1292052

简介:使用 (GET) 方法通过豆瓣影片唯一标识 id 来获取相关评论

::: tip Notice
由于豆瓣的限制,非登录用户最多只能获取到 220 条/11 页评论
:::

https://api.xhboke.com/movie/review?id=1292052

https://api.xhboke.com/movie/celebrity?id=1274297

https://api.xhboke.com/movie/top250?page=0

https://api.xhboke.com/movie/tag

❸ Python爬虫实战(1)requests爬取豆瓣电影TOP250

爬取时间:2020/11/25
系统环境:Windows 10
所用工具:Jupyter NotebookPython 3.0
涉及的库:requestslxmlpandasmatplotlib umpy

蛋肥想法: 先将电影名称、原名、评分、评价人数、分类信息从网站上爬取下来。

蛋肥想法: print数据列表后发现电影原名、分类信息等存在不需要的字符,需预先处理;同时因为后续想做一个豆瓣电影TOP250的维度分布图,而同一电影存在多个发行国家、类型(如“法国 美国 / 剧情 动作 犯罪”),为了简(偷)便(懒),这里均取第一个作为记入的数据;最后将数据保存为xlsx。

蛋肥想法: 蛋肥想知道在豆瓣电影TOP250中年份、国家、类型的维度数据,为了练手,使用刚才保存成xlsx的数据,并分别画成雷达图、柱形图、扇形图。

❹ 电影海报网站

以下为网友整理:
http://www.douban.com/note/71150011/(此网友的日记)去哪里找大尺寸的电影图片 (11.13更新) http://www.douban.com/note/71150011/
【海报】Posters 注意!!!区别预告海报与正式海报,海报上档期写着coming soon、或者只有年份/月份而没有具体日期的,一般都是预告海报,就这么简单。 |英文| ★★★★★ www.movieposterdb.com 电影海报数据库(需要积分下载)——没有积分的话,主要用来查找【海报国别】也不错 海报齐全、数量多、图大的让人吃惊,有国别区分,无水印,需注册;注册后有1分积分,每下载一张海报扣1分,上传一张海报得1分(07年之后海报为2分);他人上传更大的海报时,删除小海报会扣回分 ★★★★★ www.impawards.com 互联网电影海报库 很好的网站,收录电影比较齐全,多为官方海报,老电影海报较少,尺寸为525x755左右的居多;无新上映电影海报质量较高(无国别区分),每天都有通知更新增加,该网站已成为IMDb网站的一个固定海报连接 ★★★★ http://www.criterion.com/ CC标准版DVD封面 ★★★★ www.awardsdaily.com/FYC/gallery/ For Your Consideration 供你参考海报(FYC),颁奖季竞选海报 ☆☆☆ www.cinemasterpieces.com 原创老式海报收藏,好莱坞老电影为主,多大图 ☆☆☆ www.blu-ray.com 有大尺寸的蓝光封套,图片在每个条目封面下方:Large: Front Back,可选封面正反两面。 ☆☆☆ http://www.moviegoods.com 右上角搜索片名,选影片,View Larger 老海报补遗用,够清晰,各国版本分类详细,唯一遗憾是没有大图,都是500x700多的(cupidboy、Sofie推荐) |西班牙| ★★★★★★ http://www.cartelespeliculas.com/wp/(力荐,唯一给6星的网址。国别分类清楚,只用这一个都很受用)非常好的西班牙语网站,各国海报,尺寸大而全,无水印,特色为早期电影海报,新片一般是在上映之后才列出海报;不幸的是,该站服务器于08年10月受损,丢失多达56,000张电影海报数据,正恢复建设中,现只可提供部分存档海报。 ☆☆☆ http://www.estoescine.com/ 各国海报/剧照,但尺寸有压缩 推荐 ☆☆ http://www.caratulasdecine.com/0_9.htm(每部电影附一张海报) ☆ http://tepasmas.com/(西班牙电影资讯网站,一般有一张海报,提供剧照) |德国|(Plakat海报、Bilder剧照/图片、Desktop壁纸) ★★★★☆ http://www.posterdb.de/ (推荐,需要登录后才能下大图)新片海报质量较好,各国海报,德国版本质量尤佳,老电影海报丰富;进入网站后点左上角英国国旗,简单注册后,即可下载原版尺寸海报(超大海报) ☆☆☆ http://www.farbfilm-verleih.de/index.html 德国电影资讯网站,无搜索功能;一部电影附一张海报,尺寸较大。另附相关剧照。下载方法:点击一部电影,下拉,找到Plakat(海报) ,Download ☆☆☆ http://www.moviemaze.de/media/poster/ 主要下预告片,同时有海报/桌面 ☆☆☆ http://www.filmposter-archiv.de/ 需要用代理上(桃桃林林 推荐) |俄罗斯|(Постеры海报、кадры剧照、Обои壁纸) ★★★★ http://www.filmz.ru/ 直接下大图(推荐)最顶上的框里输片名,点后面的按钮,选择影片,有海报(无国别区分),大剧照,热门新片有超大尺寸图片,2000甚至3000像素以上的都比较全。(cupidboy 推荐) ★★★★ www.kinogallery.com/ 更新较快,不仅有海报,剧照、壁纸也很全很清晰。在右上方的搜索栏输入片名,但eat pray love片名不要输标点,要不搜不到。(cupidboy 推荐) ★★★★ http://www.kinofilms.com.ua/ 海报数量较多,国家版本也多,但无国别显示、区分,需要自己辨别。 ★★★★ www.kino-govno.com/ 这个也可以,但主要是下高清预告片(cupidboy 推荐) ☆☆☆ www.kinopoisk.ru/level/17 新片海报及横版海报为本站特色,质量较高;更新快,收集全,老片资源也较为丰富;剧照同样丰富,可惜的是有些海报/剧照右下角有方块水印。(cupidboy 推荐) ☆☆☆ http://photos.telestrekoza.com/ 电视剧海报,高像素,热门剧集 |法国| ★★★★ http://www.toutlecine.com/ 右键点击不能直接下载,可以在Firefox浏览器里安装Web Developer工具栏,然后在“禁用”里“禁用所有Javascript”,重启浏览器即可点击右键保存图片了。IMDb图片下载同理。(soto�6�4 推荐) ☆☆☆ http://www.fan-de-cinema.com/ 推荐 法国电影综合网站,多为法国上映电影海报,也有他国版 ☆☆☆ http://www.allocine.fr/film/default.html 法国电影资料网站,海报一般为法国版本,大小为600x800,附剧照 ☆☆☆ http://www.alyon.org/generale/theatre/cinema/affiches_cinema/ 老电影海报网站,法国版本海报,图片一般有网纹特征,较全,以列表形式出现,但无查询功能 |波兰| ★★★★ http://www.raraavis.krakow.pl/Katalog87/a87-05plakaty.htm 波兰电影海报 |土耳其| ★★★★ http://www.sadibey.com/turkce-afisleri/ 土耳其版海报,依照影片名的字母和数字顺序排列,点击即可看到海报 |瑞士| ☆☆ http://www.columbusfilm.ch/ 影院预告网站,找到DOWNLOADS即可下载海报 ☆☆ http://outnow.ch/media/posters/ 0809年之前的片子会有水印,请注意 |巴西| ☆☆☆ http://epipoca.uol.com.br/index.php 海报、剧照都有 |捷克| ☆☆☆ http://www.filmynadvd.cz/ DVD封套网站,尺寸大,封套背面有网站水印 |韩国| ★★★★★ http://movie.daum.net/ 大量韩版海报,同时有很多欧美新片大尺寸剧照。剧照尺寸比英文网站还要大。 ☆☆☆ http://movie.naver.com/ 提供韩版海报或者原版海报,韩版海报质量较高,近年的片子有许多尺寸是900x1283;部分海报有水印;某些电影海报需要实名注册或付费;剧照质量佳(Sofie 推荐) ☆☆ http://movie.empas.com/ 韩国上映电影海报,尺寸600x800,某些海报需注册后才能看 ☆☆ http://www.movist.com/movies/ ☆☆ http://www.joycine.com/ ☆ http://www.cine21.com/ |香港| ★★★☆ http://www.movieblog.com.hk/ 地道的港版海报,数量不多,但是每一张海报右键另存后,你会发现图片尺寸都超大。 |台湾| ☆☆☆ http://gallery.photowant.com/B/ 台湾的一个,有海报和剧照(桃桃林林、54f8in 推荐) |内地| ★★★★ http://www.g-film.com/ 世纪环球在线,海报、剧照都比较大。
【剧照】Stills |英文| ★★★★★ http://www.allmoviephoto.com/ 直接下大图(推荐),每张图片下面都有详细的文字注释。 ★★★★★ http://www.aceshowbiz.com/movie/stills/ 直接下大图(推荐),有大剧照,2000、3000、甚至6000像素。但是也有小尺寸,只是位置比较靠后,新闻图片、DVD封套、原声碟封套、桌面壁纸同时都有收录。 ★★★★ http://www.moviepicturedb.com/ 电影图片数据库(积分下载) 剧照/壁纸齐全、数量多、图大的让人吃惊,无水印,需注册;注册后有1分积分,每下载一张海报扣1分,上传一张海报得1分(07年之后海报为2分);他人上传更大的海报时,删除小海报会扣回分 ★★★☆ http://www.monstersandcritics.com/movies/moviepictures/movie-pictures.php 直接下大图,貌似现在搜索有问题了 ☆☆☆ http://www.movieweb.com/ 电影图片资料站(剧照较多),无水印,多为新片官方海报 中图 ☆☆☆ http://www.empireonline.com/gallery/list.asp?f=1 《帝国》剧照/海报/红毯 ☆☆☆ http://movies.yahoo.com/photos/movie-stills/43 中图 ☆☆ http://www.ropeofsilicon.com/movie/stills/ 有大有小,且图片不易保存 ☆ http://www.hollywood.com/movies/movie_stills_archive 小图 |韩国| ★★★★★ http://movie.daum.net/ 有很多欧美新片大尺寸剧照。剧照尺寸比英文网站还要大。 ☆☆☆ http://movie.naver.com/ 提供韩版海报或者原版海报,韩版海报质量较高,近年的片子有许多尺寸是900x1283;部分海报有水印;某些电影海报需要实名注册或付费;剧照质量佳。 ☆☆☆ http://www.hancinema.net/index.php 韩国的一个海报网,电影电视剧都有,韩国电影海报很少有这种综合型的,而且还是英文网(桃桃林林 推荐) |内地| ★★★★ http://www.sfs-cn.com/ 海上电影,难得有一个华语网站,有很多在国内公映的海外电影剧照大图下载。华语片阵地。 ★★★★ http://www.g-film.com/ 世纪环球在线,海报、剧照都比较大。 |俄罗斯|(Постеры海报、кадры剧照、Обои桌面) ★★★★★ http://www.filmz.ru/ 直接下大图(推荐)最顶上的框里输片名,点后面的按钮,选择影片,有海报,大剧照,热门新片有超大尺寸图片,2000甚至3000像素以上的都比较全。(cupidboy 推荐) ★★★★★ www.kinogallery.com/ 更新较快,剧照、壁纸很全很清晰。在右上方的搜索栏输入片名,但eat pray love片名不要输标点,要不搜不到。(cupidboy 推荐) ★★★★ http://www.kinokadr.ru/ 这个也不错,可以做补充。点1 ... 4 5 6 7 8 9 10 11下面的“смотреть кадры в большом размере”就变成清晰大剧照了~搜索栏在最顶上 ★★★★ http://www.kinofilms.com.ua/ 基本都是大图 ☆☆☆ www.kinopoisk.ru/level/17 新片海报及横版海报为本站特色,质量较高;更新快,收集全,老片资源也较为丰富;剧照同样丰富,可惜的是有些海报/剧照右下角有方块水印。(cupidboy 推荐) |德国|(Plakat海报、Bilder剧照/图片、Desktop桌面) ★★★★ http://www.farbfilm-verleih.de/index.html 德国电影资讯网站,无搜索功能;一部电影附一张海报,尺寸较大。另附相关剧照。下载方法:点击一部电影,下拉,找到Bilder(剧照),Download ☆☆☆ http://www.filmstarts.de/ 海报和剧照都有,但都不是很全,尺寸也一般。不过旧片资源可能会比新片资源要好一些。不妨找找看。 ★★★★ http://www.ascot-elite.ch/moles/obomovie/?page_id=1&lang=1&navTitle=Filme (电影数量少,大部分电影都没有可供下载的资源,但仅有的百来部电影资源比较珍贵)尺寸大,质量高,剧照多,海报/桌面其次。进入单个电影页面后,点击右侧海报下面的“Downloadarea”,里面分别有:剧照、海报、文本文件、壁纸、插图、音频等内容,还算丰富。(系统退步 推荐) |法国| ★★★★ http://www.toutlecine.com/ 右键点击不能直接下载,可以在Firefox浏览器里安装Web Developer工具栏,然后在“禁用”里“禁用所有Javascript”,重启浏览器即可点击右键保存图片了。IMDb图片下载同理。(soto�6�4 推荐) ☆☆☆ http://www.allocine.fr/film/default.html 法国电影资料网站,海报一般为法国版本,大小为600x800,附剧照 ☆☆ http://www.cinempire.com/ 多为剧照,一般提供一张海报 |西班牙| ☆☆☆ http://www.estoescine.com/ 各国海报/剧照,但尺寸有压缩 推荐 ☆ http://tepasmas.com/(西班牙电影资讯网站,一般有一张海报,提供剧照) |巴西| ☆☆☆ http://epipoca.uol.com.br/index.php 海报、剧照都有
【壁纸】Wallpapers 常见的电影桌面壁纸尺寸有:800*600、1024*768、1280*800、1280*960、1280*1024、 1600*1000、1600*1200、1600*1280、1680*1050、1920*1080、1920*1200等11种,不是每部电影都有以上尺寸的,一般也就3-5种为主。 鉴于很多都在上面的海报和剧照网站附带着有了,以下几个主打壁纸: |英文| ★★★★★ http://www.themoviedb.org/ 其实桌面壁纸只要上这个网站很多东西都到手了(desperado 推荐) ★★★★ http://www.allmoviewalls.com 新片壁纸很多 ★★★★ http://www.moviewallpaper.net/ 也是个电影壁纸网站,挺不错的,一直在用~ (Opheliaの影子 推荐) ☆☆ http://www.cinematicwallpaper.com |俄罗斯| ★★★★★ www.kinogallery.com/ 更新较快,壁纸很全很清晰。在右上方的搜索栏输入片名,但eat pray love片名不要输标点,要不搜不到。(cupidboy 推荐) ★★★★★ http://www.filmz.ru/ 直接下大图(推荐)最顶上的框里输片名,点后面的按钮,选择影片,有海报,大剧照,各种壁纸。热门新片有超大尺寸图片,2000甚至3000像素以上的都比较全。(cupidboy 推荐) ★★★★ http://www.kinofilms.com.ua/wallpapers/ 有单独的壁纸版块,可以在这个页面看到最近更新的电影壁纸 ★★★★ http://www.kinomania.ru/ 壁纸比剧照更丰富,壁纸尺寸较多,且比较直观 |德国| ★★★★ http://www.moviemaze.de/media/wallpaper/ 主要下预告片,同时有海报/桌面 |内地| ☆☆☆ http://www.wallcoo.com/ 猫猫壁纸酷,提供电影类 1024*768 | 1280*1024 | 1280*800 | 1440*900 | 1680*1050 | 1920*1200 | 6 种尺寸桌面壁纸下载 ps:日记中三张《驯龙高手》剧照的原图地址: 图片1: http://img2.douban.com/view/photo/raw/public/p456604559.jpg 尺寸:1280x543 图片2: http://t.douban.com/view/photo/raw/public/p443416204.jpg 尺寸:3384x1438 图片3: http://img2.douban.com/view/photo/raw/public/p451865228.jpg 尺寸:5400x2295 ps:如果你想找某张剧照的出处,可以直接在google按照 “具体尺寸 + 英文片名” 方法检索,应该就会找到想要找的那张剧照。比如《时光旅行者的妻子》: 在google(英文)搜索“6144x4096 The Time Traveler's Wife”得到: http://www.aceshowbiz.com/still/00001062/time_traveler_s_wife08.html 右键保存或复制网址 ps:www.tineye.com TinEye网站,可以根据小图找大图

❺ Python豆瓣电影《肖申克的救赎》评论爬取

先看效果图:

地址:( https://movie.douban.com/subject/1292052/comments?sort=time&status=P)

爬取前1w条评论

存储成txt文档

数据预处理

中文分词

统计top10的高频词

可视化展示高频词

根据词频生成词云

审核评论

================================================================

配置准备

中文分词需要jieba

词云绘制需要wordcloud

可视化展示中需要的中文字体

网上公开资源中找一个中文停用词表

根据分词结果自己制作新增词表

准备一张词云背景图(附加项,不做要求)

paddlehub配置

#安装jieba分词和词云

pip install jieba

pip install wordcloud

#安装paddle

pip install --upgrade PaddlePaddle

#安装模型

#hub install porn_detection_lstm==1.1.0

pip install --upgrade paddlehub

pip install  numpy

#安装Beautifulsoup

pip install BeautifulSoup4

Github地址: https://github.com/mikite/python_sp_shawshank

有可能遇到的问题:

1.UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe8 in position 1: invalid continuation byte

解决方法:

1.不使用urlLib换做requests

2.去掉请求头中的 'Accept-Encoding': 'gzip, deflate, br'

3.返回值reponse 转字符串指定编码utf-8

# 'Accept-Encoding': 'gzip, deflate, br',

2.关于cookie

解决方法:

1.去豆瓣请求头中复制cookie设置到请求头中

'Cookie': 'bid=WD6_t6hVqgM'

3.请求返回418的问题

解决方案模拟设置请求头,设置user-agent

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36',

4.使用beautifulsoup获取不到评论

解决方法:

第一步:指定解析参数为'lxml'

soupComment = BeautifulSoup(html, 'lxml')

第二步:

findAll方法指定css文件的class名

print('网页内容:', soupComment.prettify())

comments = soupComment.findAll(class_='short')

点击获取源码

❻ 批量爬取豆瓣影视短评步骤

用Python批量爬取豆瓣影视短评步骤:
1、通过Chrome浏览器检查元素。
2、获取单个页面HTML文本。
3、用正则表达式解析出所需要的信息并存入列表。
4、将列表中的信息存成csv文件。
5、利用start参数批量爬取其他页的短评。

❼ python怎么抓取豆瓣电影url

#!/usr/bin/env python2.7# encoding=utf-8"""
爬取豆瓣电影TOP250 - 完整示例代码
"""import codecsimport requestsfrom bs4 import BeautifulSoup

DOWNLOAD_URL = 'httn.com/top250/'def download_page(url):
return requests.get(url, headers={ 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36'
}).contentdef parse_html(html):
soup = BeautifulSoup(html)
movie_list_soup = soup.find('ol', attrs={'class': 'grid_view'})

movie_name_list = [] for movie_li in movie_list_soup.find_all('li'):
detail = movie_li.find('div', attrs={'class': 'hd'})
movie_name = detail.find('span', attrs={'class': 'title'}).getText()

movie_name_list.append(movie_name)

next_page = soup.find('span', attrs={'class': 'next'}).find('a') if next_page: return movie_name_list, DOWNLOAD_URL + next_page['href'] return movie_name_list, Nonedef main():
url = DOWNLOAD_URL with codecs.open('movies', 'wb', encoding='utf-8') as fp: while url:
html = download_page(url)
movies, url = parse_html(html)
fp.write(u'{movies}\n'.format(movies='\n'.join(movies)))if __name__ == '__main__':
main()0414243444546474849505152

简单说明下,在目录下会生成一个文档存放电影名。python2

❽ 怎样避开豆瓣对爬虫的封锁,从而抓取豆瓣上电影内容

用前嗅的ForeSpider数据采集软件可以采集,我之前采过豆瓣的影评,可以设置各种过滤规律,比如我只要豆瓣评分6.0以上的电影,就可以精确的过滤。ForeSpider可以智能模拟浏览器和用户行为,突破反爬虫限制。可以设置代理IP,并且可以自动过滤优质IP代理,提高使用代理的速度。
对于一些高难度的网站,反爬虫措施比较多,可以使用ForeSpider内部自带的爬虫脚本语言系统,简单几行代码就可以采集到高难度的网站。
可以去下载免费版,免费版不限制采集功能。有详细的操作手册可以学习。如果自己不想学习,可以让前嗅进行配置。
而且客服可以教你怎样用,有问题出错了客服会远程操作,非常好的服务态度。

❾ 如何通过豆瓣API获取图书和电影列表

豆瓣API提供了一种简单的方式可以直接在HTML页面中使用API,下面给出这种使用方式的简单示例。

  1. 首先我们需要在HTML页面中做如下script标签:<script type="text/javascript" src=" />

  2. 然后就可以调用豆瓣API,其中通过定义callback函数来操作返回的JSON数据。

  3. 此外,豆瓣也提供了解析函数来帮助你更容易地使用JSON格式的返回值。使用豆瓣提供的解析函数,你需要在页面中添加script标签:<script type="text/javascript" src="。

  4. 接下来你就可以使用豆瓣提供的解析函数来处理返回值,例如:var book = DOUBAN.parseSubject(result)。

  5. 解析函数返回更容易使用的javascript对象,你可以这样得到书的封面图片:book.link.image

  6. HTML页面使用API获得ID为xxxxx电影的信息并展示在页面上(注意将{yourapikey}替换为你的API Key)。

注:实现上,豆瓣API使用 JSONP 方式来支持跨域调用API 因此你也可以使用自己熟悉的javascript库来调用JSONP风格的豆瓣API. 此时,你需要将alt设置为xd同时提供callback参数。另外部份的豆瓣功能及操作可登陆下面的网站/客户端: