职位要求: |
职位详情
岗位职责: 1、根据公司业务需要,对指定信息源进行数据抓取; 2、研究和应对反爬策略,爬取的稳定性; 3、维护现有爬虫相关工作 4、负责信息抽取、数据清洗等研发和优化工作; 5、负责抓取数据的解析入库,爬虫系统的监控和异常警报。 6、使用flask框架编写上传接口,提供给终端系统上传数据.
任职资格: 1、三年以上的爬虫经验,两年后台开发 2、熟悉Scrapy、Beautifulsoup、Selenium等爬虫框架或工具包 3、熟悉MYSQL,Redis ,Mongodb等数据库 4、熟悉网页结构分析,包括HTML、XPath、正则表达式、AJAX、HTTP协议等 5、熟悉爬虫抓取原理,了解反爬策略 6、熟悉操作系统Windows平台、代码管理(git)等 7、有较强的数据分析与处理能力尤佳 8、熟悉Java优先.
加分项: 1.对接过广东省或其他省的基本公共卫生管理系统者优先. 查看全部 工作地点 广州天河区富力盈力大厦北塔广州市天河区富力盈力大厦北塔509联安健康 |