机器学习十大算法总览(含Python3.X和R语言代码) 您所在的位置:网站首页 r语言实现logistic回归 机器学习十大算法总览(含Python3.X和R语言代码)

机器学习十大算法总览(含Python3.X和R语言代码)

2023-03-16 14:16| 来源: 网络整理| 查看: 265

引言一监督学习二无监督学习三强化学习四通用机器学习算法列表 线性回归Linear Regression逻辑回归Logistic Regression决策树Decision Tree支持向量机SVM Support Vector Machine朴素贝叶斯Naive BayesK近邻KNN K- Nearest NeighborsK均值K-Means K-means如何形成群类 随机森林Random Forest降维算法Dimensionality Reduction Algorithms梯度提升算法Gradient Boosting Algorithms 1 GBM2 XGBoost3 LightGBM4 Catboost 总结

引言

整体来说,机器学习算法可以分为3大类

一、监督学习:

工作原理:该算法由自变量(协变量、预测变量)和因变量(结果变量)组成,由一组自变量对因变量进行预测。通过这些变量集合,我们生成一个将输入映射到输出的函数。 训练过程达到我们设定的损失阈值停止训练,也就是使模型达到我们需要的准确度等水平。

监督学习的例子:回归,决策树,随机森林,KNN,逻辑回归等

二、无监督学习:

工作原理:在无监督学习算法中,我们没有目标或结果变量来预测。 通常用于不同群体的群体聚类。

无监督学习的例子:Apriori算法,K-means。

三、强化学习:

工作原理: 强化学习(reinforcement learning),又称再励学习、评价学习,学习不是单一方法,而是一种机器学习方式,在智能控制机器人及分析预测等领域有许多应用。

强化学习例子:马尔可夫决策过程

四、通用机器学习算法列表

此处列举常用的机器学习算法, 这些算法几乎可以应用于所有的数据问题:

线性回归Logistic回归决策树SVM朴素贝叶斯KNNK均值随机森林降维算法梯度提升算法 1.GBM 2.XGBoost 3.LightGBM 4.CatBoost 1.线性回归(Linear Regression)

它用于连续变量的估计(比如说房屋成本,总销售额等)。 此处,我们通过拟合自变量和因变量之间的最佳拟合直线来建立它们之间的关系。 这条线就被叫做回归线,由线性方程表示为: y=a∗X+b 。

在上述等式中,各自代表意义如下:

Y - 因变量a - 斜率,坡度X - 自变量b - 截距项

系数a和b是基于数据点与回归线之间的距离的差的平方之和最小化而得出的。

看下面的例子。 这里我们已经确定了具有线性方程y = 0.2811x + 13.9的最佳拟合线。 现在使用这个等式,可以由一个人的重量,知道一个人的大体身高:

线性回归主要有两种类型:简单线性回归和多元线性回归:

简单线性回归的特征是一个自变量。多元线性回归(顾名思义)是以多个(多于一个)自变量为特征的。

Python 代码

#Import Library #Import other necessary libraries like pandas, numpy... from sklearn import linear_model #Load Train and Test datasets #Identify feature and response variable(s) and values must be numeric and numpy arrays x_train=input_variables_values_training_datasets y_train=target_variables_values_training_datasets x_test=input_variables_values_test_datasets # Create linear regression object linear = linear_model.LinearRegression() # Train the model using the training sets and check score linear.fit(x_train, y_train) linear.score(x_train, y_train) #Equation coefficient and Intercept print('Coefficient: \n', linear.coef_) print('Intercept: \n', linear.intercept_) #Predict Output predicted= linear.predict(x_test)

R 语言代码

#Load Train and Test datasets #Identify feature and response variable(s) and values must be numeric and numpy arrays x_train


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有