机器学习简介:机器学习是一种旨在从经验中学习的技术。例如,作为人类,您可以通过观察其他人下棋来学习如何下棋。以同样的方式,计算机通过向它们提供数据来进行编程,它们从中学习并能够预测未来的元素或条件。
例如,假设您想编写一个程序来判断某种水果是橙子还是柠檬。您可能会发现编写这样的程序很容易,它会给出所需的结果,但您也可能会发现该程序对于大型数据集不能有效地工作。这就是机器学习发挥作用的地方。
机器学习是什么?
⭐️:机器学习是一门涉及数学、统计学、计算机科学等的学科。
⭐️:机器学习是从一个大量的已知数据中,学习如何对未知的新数据进行预测,并且可以随着学习内容的增加,提高对未来数据预测的准确性的一个过程。(着重强调过程,就相当于是从已知去预测未知)
⭐️:例如,在购物时,机器学习算法自动根据浏览历史,推荐用户感兴趣的商品。这点我相信大家在逛淘宝等等的时候都有所体会吧!
机器学习算法可以分为三大类:无监督学习、有监督学习和半监督学习。
那么接下来就简单介绍以下这三类是个什么意思。
无监督学习:不需要提前知道数据集的类别标签,可分为聚类和降维两个领域。
有监督学习:使用有标签的训练数据建立模型,用来预测新的未知标签的数据,可分为分类和回归两个领域。(分类是预测离散值,回归是预测连续值)
半监督学习:无监督学习和有监督学习的结合。
为什么选择机器学习
例如垃圾邮件的识别和清理,这是*设计的规则体系来设计“智能应用”的一个实例,人为制订的决策规则对某些应用来说是可行的,特别是人们对其模型处理过程非常熟悉的应用
做决策所需要的逻辑只适用于单一领域和单项任务任务,哪怕稍有变化,都可能需要重写整个系统
想要制订规则,需要对人类*的决策过程有很深刻的理解
但是如果有了机器学习,向程序输入海量人脸图像,就足以让算法确定识别人脸需要哪些特征
课程简介
熟练掌握数据科学领域的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
善用机器学习解决用户画像、精准营销、风险管理等商业问题
机器学习基础薄弱学员
高校在校生
待业、期待转行从事数据挖掘相关岗位的在职人员
CDA数据分析师level Ⅲ 考生。
希望借助数据挖掘算法来提升解决企业运营、产品运营中涉及的预测问题者
对数据挖掘技术感兴趣的各界人士
产品、运营、营销、管理、咨询相关岗位从业者,希望增加数据挖掘技能与思维
课程大纲
1数据库基本概念
2DDL数据定义语言
3DML数据操作语言
4单表查询
5多表查询
6Python连接SQL
1Python标准数据类型
2控制流语句
3自定义函数
4异常和错误
5类与面向对象编程
6Numpy数组操作
1线性代数
2微积分
3描述性统计
4参数估计
5假设检验
6相关分析
7卡方分析
8一元线性回归理论推导
9多元线性回归理论推导
1分布式存储与计算
2Spark与Flink工作原理
3使用PySpark实现分布式计算
4数据接入策略与调度工具
1数据挖掘导论
2KNN
3贝叶斯
4SVM
1决策树(ID3, C4.5, CART)
2决策树的模型调优
3病马死亡归类与识别案例
4用户分类-保险行业用户分类分析
1带正则项的回归分析
2大数据环境下的回归分析实现(Spark实现)
1集成学习的理论基础
2AdaBoost
3随机森林及其Spark实现
4GBDT, XGBoost, LightGBM及Python实现
1关联规则(关联规则的概念,评估指标,Apriori算法)
2协同过滤
3大数据环境下的协同过滤实现
4产品组合策略-电信公司产品捆绑销售策略分析案例
1数据处理的前沿方法:特征工程概要
2数据不平衡问题
3特征工程(特征的建构、选择、转换、学习)
4感知器及多层感知器
11深度神经网络基础
12BP神经网络架构
13反向传播算法
14梯度与学习率专题
15图像分析-手写数字自动识别
11数据的爬取(http原理、requests应用)
12文本数据清洗(正则表达式、HTML结构及xpath应用)
11分词与词性标注
12文本信息提取
13词嵌入(CBOW与Skip-gram)
14构建文本信息库
15文本聚类算法
11聚类分析进阶(密度聚类,高斯混合聚类,谱聚类)
12异常识别(孤立森林,局部异常因子)
13交易反欺诈-异常交易识别案例
机器学习进阶(Level 3)第6周-大型项目案例
11实战项目-金融行业反欺诈
11卷积神经网络CNN
12循环神经网络RNN与LSTM
13残差网络ResNet
14注意力机制Attention
15预训练框架Transformer与迁移学习
16Bert专题
17Pytorch框架与代码实践(NLP案例)
18大型项目案例-实战项目-信用评分卡
11数据挖掘概论
12高级数据处理与特征工程
13自然语言处理与文本分析
14机器学习算法
15机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化)
11互联网数字化运营
12何为数据产品经理
13Python 爬虫
14人工智能(深度学习)实战之图像识别
15Tableau 多维可视化分析
16SPSS 统计分析