Movatterモバイル変換


[0]ホーム

URL:


Skip to content

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫

License

NotificationsYou must be signed in to change notification settings

norway5354/MediaCrawler

 
 

Repository files navigation

免责声明:

本仓库的所有内容仅供学习和参考之用,禁止用于商业用途。任何人或组织不得将本仓库的内容用于非法用途或侵犯他人合法权益。本仓库所涉及的爬虫技术仅用于学习和研究,不得用于对其他平台进行大规模爬虫或其他非法行为。对于因使用本仓库内容而引起的任何法律责任,本仓库不承担任何责任。使用本仓库的内容即表示您同意本免责声明的所有条款和条件。

小红书爬虫抖音爬虫快手爬虫B站爬虫微博爬虫...。
目前能抓取小红书、抖音、快手、B站、微博的视频、图片、评论、点赞、转发等信息。

原理:利用playwright搭桥,保留登录成功后的上下文浏览器环境,通过执行JS表达式获取一些加密参数通过使用此方式,免去了复现核心加密JS代码,逆向难度大大降低

爬虫技术交流群:949715256,同时欢迎大家贡献代码提交PR

视频配置教程:MediaCrawler视频入门教程

感谢下列Sponsors对本仓库赞助

全球ip代理超新星IPCola,  全球ip代理超新星-官网图

你也可以通过注册这款免费的ChatGPT产品,帮我获取额外的GPT-4额度作为支持,也是我每天都在用的一款chrome效率插件,推荐给你

成为赞助者,展示你的产品在这里,联系作者:relakkes@gmail.com

功能列表

平台Cookie 登录二维码登录指定创作者主页关键词搜索指定视频/帖子 ID 爬取登录状态缓存数据保存IP 代理池滑块验证码
小红书
抖音
快手
B 站
微博

使用方法

创建并激活 python 虚拟环境

# 进入项目根目录cd MediaCrawler# 创建虚拟环境python -m venv venv# macos & linux 激活虚拟环境source venv/bin/activate# windows 激活虚拟环境venv\Scripts\activate

安装依赖库

pip3 install -r requirements.txt

安装 playwright浏览器驱动

playwright install

运行爬虫程序

# 默认没有开启评论爬取模式,有需要请到配置文件中指定# 从配置文件中读取关键词搜索相关的帖子并爬去帖子信息与评论python main.py --platform xhs --lt qrcode --type search# 从配置文件中读取指定的帖子ID列表获取指定帖子的信息与评论信息python main.py --platform xhs --lt qrcode --type detail# 打开对应APP扫二维码登录# 其他平台爬虫使用示例, 执行下面的命令查看python main.py --help

数据保存

  • 支持保存到关系型数据库(Mysql、PgSQL等)
  • 支持保存到csv中(data/目录下)
  • 支持保存到json中(data/目录下)

打赏

如果觉得项目不错的话可以打赏哦。您的支持就是我最大的动力!

打赏时您可以备注名称,我会将您添加至打赏列表中。

打赏-微信打赏-支付宝

捐赠信息

PS:如果打赏时请备注捐赠者,如有遗漏请联系我添加(有时候消息多可能会漏掉,十分抱歉)

捐赠者捐赠金额捐赠日期
Nate Yang20 元2024-03-19
Tsen Ming100 元2024-03-18
*皓50 元2024-03-18
*刚50 元2024-03-18
*乐20 元2024-03-17
*木20 元2024-03-17
*诚20 元2024-03-17
Strem Gamer20 元2024-03-16
*鑫20 元2024-03-14
Yuzu20 元2024-03-07
**宁100 元2024-03-03
**媛20 元2024-03-03
Scarlett20 元2024-02-16
Asun20 元2024-01-30
何*100 元2024-01-21
allen20 元2024-01-10
llllll20 元2024-01-07
邝*元20 元2023-12-29
50chen50 元2023-12-22
xiongot20 元2023-12-17
atom.hu20 元2023-12-16
一呆20 元2023-12-01
坠落50 元2023-11-08

运行报错常见问题Q&A

遇到问题先自行搜索解决下,现在AI很火,用ChatGPT大多情况下能解决你的问题免费的ChatGPT推荐

➡️➡️➡️常见问题

项目代码结构

➡️➡️➡️项目代码结构说明

手机号登录说明

➡️➡️➡️手机号登录说明

star 趋势图

  • 如果该项目对你有帮助,star一下 ❤️❤️❤️

Star History Chart

参考

About

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python100.0%

[8]ページ先頭

©2009-2025 Movatter.jp