培训对象
大数据培训课程招生对象:非艺术类毕业生,大专及以上学历;入门数据分析师课程大纲,细分层级进阶教学,不仅要学会,更要学精。分模块进阶教学,每你都在进步!
问题定义与数据获取
数据分析项目流程
1、问题界定
2、问题拆分
3、指标确定
4、数据收集
5、报告方案
6、趋势预测
7、数据分析
8、趋势预测
9、报告方案
问题的定义
1、边界:明确问题的边界
2、逻辑:确定业务的关键指标和逻辑
3、定性分析与定量分析
分析问题的模型
1、5W2H
2、SWORT
3、4P管理模型
4、CATWOE
5、STAR原则、波士顿5力模型
数据清洗与处理
1、数据科学过程 2、数据清洗定义
3、数据清洗任务 4、数据清洗流程
5、数据清洗环境 6、数据清洗实例说明
7、数据标准化 8、数据格式与编码
9、数据清洗常用工具 10、数据清洗基本技术方法
11、数据抽取 12、数据转换与加载
内部数据的获取
1、产品数据 2、用户数据
3、行为数据 4、订单数据
外部公开数据
1、开放网站 2、政务公开数据
3、数据科学竞赛 4、数据交易平台
5、行业报告 6、指数平台
基于业务的模型
1、用户画像
2、 销售影响因素
3、市场变化因素
4、AARRR流量模型
5、金定塔思考方法
Web网站数据抓取
1、财经数据抓取 2、投资数据抓取
3、房产数据抓取 4、舆情数据抓取
5、娱乐数据抓取 6、新媒体数据抓取
数据查询与提取 SQL基础操作
1、建库 2、建表
3、建约束 4、创建索引
5、添加、删除、修改数据 。。。。。。。
截面数据与时间序列数据
截面数据(cross section data): 是在同一时间(时期或时点)截面上搜集的数据。横截面数据不要求统计对象及其范围相同,但要求统计的时间相同,也就是说必须是同一时间截面上的数据。
时间序列数据(time series data): 是在多个不同时间点上搜集的数据。这类数据反映了某一事物、现象等随时间的变化状态或程度。
面板数据(Panel Data): 也叫“平行数据”,是指在时间序列上取多个截面,这些截面的样本数据称为面板数据。面板数据是一个m*n的数据矩阵,记载的是n个时间节点上,m个对象的某一数据指标。
数据来源
数据的来源主要分为两大类,企业 外部来源 和 内部来源。
外部来源 :外包购买、网路爬取、免费开源数据等;
内部来源:销售数据、社交通信数据、考勤数据、财务数据、服务器日志数据等;
更多培训课程,学习资讯,课程优惠等学校信息,请进入天津博为峰教育网站详细了解,免费咨询电话:400-998-6158