标签基于全网DPI数据和内容库,通过DPI二次解析技术,形成用户行为宽表基于用户行为宽表,定期沉淀用户内容偏好标签3.关联内容与目标用户,助力精准营销基于模型算法将咪咕内容找到目标用户群为特定用户群匹配感兴趣内容咪咕+杭研省公司输出结果图例杭研+咪咕互联网数据省公司标签库内容库(音乐、视频、阅读、动漫、游戏)省公司DPI数据用户内容访问宽表用户/内容标签推荐算法2省公司营销平台爬虫、统一标签定期沉淀更新内容库监控分析验证模型训练模型内容排行表推荐算法1省公司标签咪咕内容+目标用户列表特定用户群+推荐咪咕内容列表咪咕内容列表咪咕音乐竞品方案用户内容偏好模型为省内构建完善的内容库杭研爬虫工程内容库(定期更新)文件导出工程(加密)文件解析工程(解密)省公司DPI日志解析算法组件内容数据传送杭研1、爬虫工程:负责爬取网络音乐、阅读等数据,持续更新。2、内容库:将互联网内容分类映射到杭研内容分类体系,形成杭研数字内容库。3、文件导出工程:对内容库数据进行处理,形成加密文件,上传至FTP服务器。省公司1、文件解析工程:定期检查FTP服务器更新,拉取内容库数据并解密。2、省公司内容库:定时运行,同步杭研最新内容库到省公司。3、离线计算工程:对接省公司大数据平台,通过使用杭研定制的算法组件,解析DPI日志数据,形成用户行为宽表。爱奇艺分类搜狐视频分类腾讯视频分类…站点分类体系杭研分类映射表统一分类体系杭研内容分类体系构建省公司内容库视频库游戏库动漫库音乐库阅读库省内内容库的构建爬虫内容库远程部署方案注:1.一期优先部署动漫库、阅读库和视频库后期部署其余类别2.一期爬虫覆盖绿色部分,后期爬虫覆盖剩余部分,可动态调整内容库更新频率:暂定每天早上8点之前传输成功爬虫范围内容库分类样例:百度书城爬虫内容详情样例:爬虫内容库内容示例自定义分类体系标准示例:?注:杭研对咪咕内容五大类的分级体系重新梳理