使用spring boot框架开发的拥有爬虫功能的网页程序
小白作品,还请大佬多多指教
当前版本不再更新,成品网站:Steam挂刀网站
-
主要是获得buff上的饰品数据,然后在steam上获得该饰品数据,然后进行分析从而获得到:
1.如果要倒余额,会获得多少折的余额
2.如果要套现,需要多少折的余额才能回本 -
获得数据之后会在项目中储存起来,等在有人使用网页访问时展示所需的数据(最优余额,与最优套现金)
steam的cookie与buff的cookie以及悠悠的登录凭证
使用的是cookie的方式进行登录操作
- 物品的id
- 在售数量
- 最低在售
- 最高求购
- 物品的id
- 在售数量
- 最低在售
- 最高求购
这个项目不使用数据库,使用的是json文件储存- 新版本使用mysql数据库,json文件遍历太慢了
steam的爬虫爬一会就提示访问次数过多了,不知道是账号出问题了还是程序出问题了,如果有大佬知道还请告知- steam反爬策略,需要切换ip,账号似乎不用换
- steam的单页列表(搜索页)api
https://steamcommunity.com/market/search/render/?query={搜索内容,可默认空白}&start={从第几个开始}&count={一共展示多少个,一般为10}&appid={游戏id,cs2为730,dota2为570}
请求完成后返回后是json数据格式
大概为{ "success": true, "start": 10, "pagesize": 10, "total_count": 20521, "tip": "Set norender=1 if you don't want HTML", "results_html": "\t<div class=\"market_listing_table_header\">...." }也可以在请求参数中添加norender=1返回json格式的数据 results_html中包含了
- 饰品详情的链接
- 饰品缩略图
- 饰品昵称
- 饰品的出售价格
但我需要获得最高求购价与最低售价
这个需要知道饰品的id才能进行访问,所以要用到results_html中的饰品详情的链接
访问这个链接,正则查找Market_LoadOrderSpread(到)之间的内容,即可获得饰品在steam中的id
- steam饰品的详情
https://steamcommunity.com/market/itemordershistogram?&language=schinese¤cy=1&item_nameid=
饰品id
请求完成后返回后是json数据格式
内容和上面类似,自己研究
