今天给大家介绍的是《Big Data 项目实战班》的课程项目,包括项目难度、代码量、处理数据量、及课后需要花费的时间。截图部分是该课程的项目成果展示。
1. Google Auto Complete
Google搜索引擎自动补全
通过Wiki 数据集中构建 N-Gram Library
实现搜索引擎的自动补全功能
项目难易程度:⭐️⭐️⭐️☆☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
2. Article Sentiment Analysis
通过统计文章情感关键词
分析文章所表达的情绪
项目难易程度:⭐️⭐️☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M
3. Page Rank
 Google 搜索引擎排名
将通过wiki数据进行页面权重的计算
实现Page Rank这一重要算法
项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
4. Movie Recommender System
电影推荐系统
将应用 Netflix 的数据
给用户推荐他们之前喜欢的电影的相似电影
项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G
《Big Data 项目实战班》本周末免费试听!
美西时间 3月5日周日 13:00-15:00 
美东时间 3月5日周日 16:00-18:00
报名请登陆
www.jiuzhang.com
或点击文末阅读原文
继续阅读
阅读原文