搜索广告平台实战训练营将带大家实现一个端到端的搜索广告平台:电商数据爬虫,基于map reduce的数据处理,搜索广告后台,大数据处理,该项目可以运用到淘宝,亚马逊,eBay等电商网站上的搜索广告。
课程目标
理论层面:理解搜索广告的基本流程,对Query understanding,Word2Vector和Page Rank有深入的理解;掌握广告检索算法,广告排序算法,广告定价算法和广告位置算法;
实战操作:搭建数据采集用的爬虫,实现搜索广告后台,实现搜索广告的机器学习算法;
广告搜索设计层面:掌握广告数据结构,广告数据爬虫,广告后台业务流程以及核心算法
课程结构
1. 电商搜索广告的基本流程,数据结构。
详解搜索广告的实现原理,实现电商数据爬虫,模拟搜索日志数据的生成等。配置开发环境,包括:Java,MemCache, MySQL, Spark等。
2. 信息检索在广告中的应用。
实现一个基本的搜索广告服务器 v1.0。用Java实现广告的业务流程,包括:用户查询的预处理,基于MemCache建立广告关键字倒排表, 用倒排表选择广告, 计算相关度并排序。
3. 广告核心算法-Query Understanding。
实现搜索广告服务器 v2.0:用extended query查询广告索引,比较返回广告的广度变化。通过实现Query Understanding来克服搜索广告服务器 v1.0的缺陷。用Spark MLlib里的Word2Vector model实现query rewrite, 用Spark Map Reduce处理数据,提取特征,随后应用到算法中。
4.广告核心算法-排序,定价,位置分配。
实现搜索广告服务器 v3.0:优化排序算法,返回相关度更高的广告,实现广告定价和位置分配。详解广告排序算法公式,pClick(点击概率),relevance(相关度)的概念。用Spark MLlib 预测pClick和广告相关度并应用到排序算法中。
项目架构图
讲师介绍
John
Senior Software Engineer
CS研究生毕业后加入Bloomberg realtime data组, 之后加入Microsoft Bing Ads组从事搜索广告服务后台的研发, 现在就职于硅谷某FLAG公司。
课程主页
https://www.bittiger.io/livecourses/MuSPvHz5JwxCEqqRP
第一节(免费)课时间
美西时间 2月4日 07pm
美东时间 2月4日 10pm
北京时间 2月5日 11am
第一节课注册链接(原文链接)
https://zoom.us/webinar/register/e2612e1e2cc4e77c34538d7d4481ef37
联系课程负责人
Ada
加入课程讨论群
推荐课程
继续阅读