一个抓取网易云音乐精彩评论的爬虫
预览,Web端:
移动端效果:
使用技术
-
后端: Flask + Mongoengine + Mako + requests + Redis + lxml + concurrent.futures
-
前端:React + Mobx + Fetch + Material-UI + ES6 + Webpack + Babel
Getting Started
虚拟环境和安装应用依赖
❯ virtualenv venv
❯ source venv/bin/activate
❯ pip install -r requirements.txt
爬虫篇
- 创建local_settings.py文件,然后添加Redis和MongoDB配置。
- 抓取之前可以添加一些代理地址到local_settings.py中,否则会影响爬取速度。
- 修改run.py中max_workers的数量,建议选择服务器CPU核数作为这个值。 然后启动
python run.py就开始抓取了。
前端开发篇
先安装:
❯ cd assets
❯ npm install # 推荐使用cnpm, 要不然有点慢
开发:
开发时可以先修改server.js里面的主机和端口号,然后启动
目前默认后端使用8100端口,开发模式使用3000端口。
部署:
执行完毕就会在生成新的static/js/dist/index.bundle.js*文件了。
Enjoy it!

