简述机器学习的常用算法分类
好的,机器学习常用算法可以按照其核心任务、学习方式和模型类型进行如下分类(简述):
1. 按核心任务/学习范式分类(最常用方式)
-
监督学习: 算法从带有标签(正确答案) 的数据中学习规律,用于预测未知数据的标签。
- 分类: 预测离散类别(如:垃圾邮件/非垃圾邮件、图片中的物体类型)。
- 常用算法: 逻辑回归、决策树、随机森林、支持向量机、K近邻、朴素贝叶斯、神经网络。
- 回归: 预测连续数值(如:房价、销售额)。
- 常用算法: 线性回归、多项式回归、决策树(回归树)、随机森林(回归)、支持向量回归、神经网络。
- 集成学习: 组合多个基学习器以获得更好的泛化性能(常应用于分类和回归)。
- 常用方法: Bagging(如 随机森林)、Boosting(如 AdaBoost, Gradient Boosting Machines - XGBoost, LightGBM, CatBoost)、Stacking。
- 深度学习: 主要使用多层神经网络(尤其是深度网络)来处理复杂模式,广泛应用于分类、回归以及后面的计算机视觉和自然语言处理。
- 常用架构: 卷积神经网络、循环神经网络、Transformer。
- 分类: 预测离散类别(如:垃圾邮件/非垃圾邮件、图片中的物体类型)。
-
非监督学习: 算法从没有标签的数据中发现隐藏结构或模式。
- 聚类: 将数据分组到不同的簇中,使得同一簇内的数据点尽可能相似,不同簇间的数据点尽可能不同。
- 常用算法: K-Means、层次聚类、DBSCAN、高斯混合模型。
- 降维: 减少数据的特征数量,同时尽可能保留重要信息。用于可视化、去噪、特征压缩。
- 常用算法: 主成分分析、t-SNE。
- 关联规则学习: 发现数据中特征之间的关联关系(如购物篮分析)。
- 常用算法: Apriori。
- 异常检测: 识别与数据集中的大多数数据显著不同的数据点(异常点)。
- 常用算法: Isolation Forest、One-Class SVM、局部离群因子。
- 生成模型: 学习数据的分布,从而可以生成新的、与训练数据相似的数据样本。
- 常用算法: 自编码器、生成对抗网络、高斯混合模型。
- 聚类: 将数据分组到不同的簇中,使得同一簇内的数据点尽可能相似,不同簇间的数据点尽可能不同。
-
强化学习: 智能体通过与环境交互(执行动作、获得奖励/惩罚)来学习在特定场景中采取最优策略,以实现长期累积奖励最大化。
- 常用方法: Q-Learning、策略梯度法、深度Q网络(DQN)等。
- 应用: 游戏AI、机器人控制、资源调度。
-
半监督学习: 同时使用少量有标签数据和大量无标签数据进行训练,通常能比单独使用有标签数据获得更好性能。
2. 按学习方式/模型类型分类(补充视角)
- 基于实例的学习: 预测新样本时,参考与其最相似的训练样本(近邻)。
(如 KNN) - 基于模型的学习: 从数据中建立一个用于预测的模型(函数)。
(如 线性回归、逻辑回归、SVM、决策树、神经网络) - 参数模型 vs. 非参数模型:
- 参数模型: 对数据分布做出强假设,学习固定数量的参数(与样本量无关)。
(如 线性回归、逻辑回归) - 非参数模型: 不对数据分布做强假设,模型复杂度/参数可能随数据量增加而增长。
(如 KNN、决策树、SVM(基于核时))
- 参数模型: 对数据分布做出强假设,学习固定数量的参数(与样本量无关)。
- 线性模型 vs. 非线性模型:
- 线性模型: 通过特征的线性组合进行预测。
(如 线性回归、逻辑回归) - 非线性模型: 可以学习数据中复杂的非线性关系。
(如 决策树、支持向量机(使用非线性核)、神经网络)
- 线性模型: 通过特征的线性组合进行预测。
总结关键点
- 最核心的分类维度是任务范式:监督(预测)、非监督(发现结构)、强化(交互学习)。
- 监督学习内部按预测目标进一步分为:分类(离散标签)和回归(连续值)。
- 集成学习和深度学习是提升性能的关键方法或模型范式。
- 非监督学习的核心任务是聚类(分组)和降维(压缩)。
- 分类方式不是绝对互斥的,一个算法可能属于多个类别(如决策树既可用于分类也可用于回归)。
这个分类框架涵盖了机器学习中最常用和基础性的算法类别。
一种基于Q学习算法的增量分类模型
大数据时代的数据信息呈现持续性、爆炸性的増长,为杋器学习算法带来了大量监督样本。然而,这对信息通常不是次性获得的,且获得的数据标记是不准确的,这对传统的分类
资料下载
佚名
2021-05-13 14:17:24
基于自然邻居的标记分布机器学习算法
标记分布是一种新的机器学习范式,能很妤地解决某些标记多义性问题,可看作多标记的泛化。传统的单标记学习和多标记
资料下载
佚名
2021-05-13 11:46:33
基于物联网机器学习的在线GP-ELM算法
为满足物联网环境下边缘设备对机器学习算法准确、快速以及自适应产生参数的需求,在 DE-ELM的基础上提出一种在线的GP-BLM
资料下载
佚名
2021-04-02 10:47:43
常用机器学习算法的基本概念和特点
。因此对于数据科学家来说,理解算法显得格外重要,理解不同算法的思想可以帮助数据科学家更从容地面对不同的应用场景。 本文列出了常用的
2023-01-17 15:43:09
换一换
- 如何分清usb-c和type-c的区别
- 中国芯片现状怎样?芯片发展分析
- vga接口接线图及vga接口定义
- 芯片的工作原理是什么?
- 华为harmonyos是什么意思,看懂鸿蒙OS系统!
- 什么是蓝牙?它的主要作用是什么?
- ssd是什么意思
- 汽车电子包含哪些领域?
- TWS蓝牙耳机是什么意思?你真的了解吗
- 什么是单片机?有什么用?
- 升压电路图汇总解析
- plc的工作原理是什么?
- 再次免费公开一肖一吗
- 充电桩一般是如何收费的?有哪些收费标准?
- ADC是什么?高精度ADC是什么意思?
- dtmb信号覆盖城市查询
- EDA是什么?有什么作用?
- 中科院研发成功2nm光刻机
- 苹果手机哪几个支持无线充电的?
- type-c四根线接法图解
- 华为芯片为什么受制于美国?
- 怎样挑选路由器?
- 元宇宙概念股龙头一览
- 锂电池和铅酸电池哪个好?
- 什么是场效应管?它的作用是什么?
- 如何进行编码器的正确接线?接线方法介绍
- 虚短与虚断的概念介绍及区别
- 晶振的作用是什么?
- 大疆无人机的价格贵吗?大约在什么价位?
- 苹果nfc功能怎么复制门禁卡
- amoled屏幕和oled区别
- 单片机和嵌入式的区别是什么
- 复位电路的原理及作用
- BLDC电机技术分析
- dsp是什么意思?有什么作用?
- 苹果无线充电器怎么使用?
- iphone13promax电池容量是多少毫安
- 芯片的组成材料有什么
- 特斯拉充电桩充电是如何收费的?收费标准是什么?
- 直流电机驱动电路及原理图
- 传感器常见类型有哪些?
- 自举电路图
- 通讯隔离作用
- 苹果笔记本macbookpro18款与19款区别
- 新斯的指纹芯片供哪些客户
- 伺服电机是如何进行工作的?它的原理是什么?
- 无人机价钱多少?为什么说无人机烧钱?
- 以太网VPN技术概述
- 手机nfc功能打开好还是关闭好
- 十大公认音质好的无线蓝牙耳机