千图成像:用N张图片拼凑成一张图片。
实现原理:先将所要成像的图片转化成马赛克图片,然后从图库中用对应颜色的图片替换相应色块。
图库中的图片处理:标记图库中每张图片的混合颜色,用于替换目标色块英雄联盟头像获取地址,并记录每张图片的特征用于成像,增加成像质量。
起源
德莱文
图片局部
英雄联盟卡盟-微博
很久前在刷微博的时候看到了这条,被他给震撼到了,图片是由LOL近千张皮肤图片组合构成的(难道这是用ps做的,还是一张张拼的,应该不可能吧),就在昨天突然就想起了这个事,就决定也做一个,随即便展开了行动。
搜到了这篇文章,看了下图片的构成,决定先取得所有皮肤的图片再说吧!便又开始了爬虫!
运行环境:
Python3.6.5 ,pycharm-2018-1-2英雄联盟头像获取地址, win10
爬虫思路
皮肤图片的来源问题,首先到官网去找了找,想到了道聚城皮肤专卖区,其中正好有所有我们需要的图片。
通过F12锁定图片取得了第一张图片的URL()
以此类推便可取得多个皮肤的URL,发现只有图中红框处不同
尝试着改变红框内的数字,在改变后三位(122015-->122001)时,获得了另一张诺手的皮肤,基本可以确定后三位为皮肤编号,前面的数字为英雄编号,且皮肤编号必须为三位。
看到这里你可能会有所疑问,为什么不直接正则获取所需图片的URL呢?为什么要大费周章的寻找规律?
因为这个翻页式网站比较特殊,在翻页时URL并不会改变,所以无法通过常用方法获取所有皮肤。
那估计又有人要提出使用selenium库来模拟人使用浏览器获取所有图片,但是这会造成爬取图片的速度大大下降,只能作为下策(在这过程中了解到了八爪鱼,发现其原理类似于selenium,是模拟人操控浏览器,速度也是不容直视,虽然它能爬取近98%的网站),在博主能力有限的情况下选择了寻找规律之旅!
如果你有好的方法解决这个问题,可以在评论处提出,十分感谢!
接下来在知道了规律的情况下,那么如何获取每个不同英雄的编号呢?在其他博主的引导下,发现LoL资料库中有所有英雄的头像,通过F12的慢慢查找,发现了这个js文件!
查看其preview,便可得到所有英雄编号,并测试发现可用!比如Ashe艾希的第一个皮肤对应编号按规律应该是22001,所以URL就是,
测试发现确实成功了!
好了,到此为止网页分析到此结束了,终于可以编写代码了。
代码框架
1、获取英雄编号及皮肤编号(说明:关于皮肤编号并未找到每个英雄皮肤的数量,所以设置成查找所有001到015的图片,当然也可以更多020也行)
2、将编号导入图片URL(****-9.jpg )中, 生成Url_list。
3,根据URL来下载对应图片,并保存到本地。
4、完整代码
import requests
import re
import os
# # # # # # # # # # # # # #
# title:获取LOL英雄皮肤图像 #
# author:简书 Wayne_Dream #
# date:2018-7-5 #
# # # # # # # # # # # # # #
defgetHero_data():
try:
headers = {
'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
url = 'http://lol.qq.com/biz/hero/champion.js'
r = requests.get(url, headers=headers)
r.raise_for_status()
r.encoding = r.apparent_encoding
text = r.text
hero_id = re.findall(r'"id":"(.*?)","key"', text)
hero_num = re.findall(r'"key":"(.*?)"', text)
return hero_id, hero_num
except:
return '卧槽,获取英雄编码失败!'
defgetUrl(hero_num):
part1 = 'https://game.gtimg.cn/images/daoju/app/lol/medium/2-'
part3 = '-9.jpg'
skin_num = []
Url_list = []
for i in range(1, 21):
i = str(i)
if len(i) == 1:
i = '00'+i
elif len(i) == 2:
i = '0'+i
else:
continue
skin_num.append(i)
for hn in hero_num:
for sn in skin_num:
part2 = hn + sn
url = part1 + part2 + part3
Url_list.append(url)
print('图片URL获取成功')
return Url_list
defPicName(hero_id, path):
pic_name_list = []
for id in hero_id:
for i in range(1, 21):
pic_name = path + id + str(i) + '.jpg'
pic_name_list.append(pic_name)
return pic_name_list
defDownloadPic(pic_name_list, Url_list):
count = 0
n = len(Url_list)
try:
for i in range(n):
headers = {
'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
res = requests.get(Url_list[i], headers=headers).content
if len(res) < 100:
count += 1
print('r当前进度:{:.2f}%'.format(100*(count/n)), end='')
else:
with open(pic_name_list[i], "wb") as f:
f.write(res)
count += 1
print('r当前进度:{:.2f}%'.format(100*(count/n)), end='')
except:
return '卧槽,获取图片失败!'
if __name__ == '__main__':
print('author:简书 Wayne_Dream:')
print('https://www.jianshu.com/u/6dd4484b4741')
input('请输入任意字符开始爬虫:')
if os.path.exists('D:LOLimg_wayne\') == False:
path = r'D:LOLimg_wayne\'
os.mkdir(path)
hero_id, hero_num = getHero_data()
Url_list = getUrl(hero_num)
pic_name_list = PicName(hero_id, path)
print('正在下载图片,请稍等。。。')
print('在' + path + '下查看...')
DownloadPic(pic_name_list, Url_list)
print('图片下载完毕')
else:
path = r'D:LOLimg_wayne\'
hero_id, hero_num = getHero_data()
Url_list = getUrl(hero_num)
pic_name_list = PicName(hero_id, path)
print('正在下载图片,请稍等。。。')
print('在' + path + '下查看...')
DownloadPic(pic_name_list, Url_list)
print('图片下载完毕')
好了,到这里我们已经完成了LOL全皮肤的获取,接下来进行最有意思的一步,千图成像!
千图成像
初级阶段我们先使用一款国外的合成软件。
软件下载地址:
如果打不开,那就搜索“foto-mosaik-edda”下载即可!
打开后界面是这样的。
先选第一步
再选第二步create photo mosaic
效果图:
局部:
如果想直接尝试一下千图成像的,可到百度网盘下载我爬取到的皮肤图集: 密码:5arb
- END -
原文链接: