• |
  • 2020-06-02发布

爬虫实习生 面议

北京市-北京市工作经验:实习生学历:本科 浏览数:469投递数:0

职位描述

公司简介
       新浪公司是一家服务于中国及全球华人社群的领先网络媒体公司。新浪通过门户网站新浪网(SINA.com)、新浪移动(移动门户及移动应用)和社交媒体微博(Weibo.com)组成的数字媒体网络,帮助广大用户通过电脑和移动设备获得专业媒体和用户自生成的多媒体内容并与友人进行兴趣分享。
职位要求

工作地点:北京市 招聘人数:3名

实习期间表现优异者可转校招录用。

任职要求:
1.研一、研二或者大二、大三学生,实习期最好至少六个月,每周实习三到四天以上
1.熟悉python/Go等开发语言
2.了解http协议,对抓包、模拟请求、模拟登陆等有一定了解
3.能熟练掌使用xpath、正则等对html文本进行处理
4.熟练使用flask/tornado/django、scrapy等web框架
5.了解机器学习,能通过深度学习方面的知识对文本、图像、视频进行处理的更佳。


岗位职责
1. 负责新浪爬虫系统开发;
2. 负责配置网站爬虫规则;
3. 负责内容质量规则配置与优化
4. 参与自然语言处理和图片识别等相关开发。

面试评价

综合评分:
0 (来自0份评价)
  • 职业发展:
    0
  • 组织文化:
    0
  • 公司环境:
    0

公司基本信息

标语:

规模:2000人以上

地点:安徽省-合肥市

推荐职位

    • 职业发展:
    • 组织文化:
    • 公司环境:

    请答题