菜鸟数据科学入门01 | 您所在的位置:网站首页 › python常用来做什么 › 菜鸟数据科学入门01 |
数据科学是什么?为什么要学习数据科学? 来不及解释了,先上车 -。- 开车之前,为接下来的系列文章做准备,先来罗列一下 Python 科学计算生态中常见的工具包。 IPythonIPython 为 NumPy、SciPy、Pandas、Matplotlib 等包提供一个交互式接口,它本身并不提供科学计算的功能。这些工具组合在一起,形成了可以匹敌如 Matlab、Mathmatic 这些复杂工具的科学计算框架。 不同的工具包,在数据分析的不同阶段各显神通: NumPyNumPy 主要提供基础的数组数据结构和矩阵运算。 快速高效的多维数组对象可执行向量化计算提供线性代数等矩阵可集成 C 代码SciPy基于 NumPy 提供了大量的科学计算算法(信号处理、最优化求解等等),解决标准问题。 数值积分和微分方程求解扩展的矩阵计算功能最优化工具概率分布计算和统计函数信号处理函数Pandas提供 data frames 数据结构,便于处理真实数据集。 易用、高效的数据操作函数库执行 join 以及其他 SQL 类似的功能来重塑数据提供包括 dataframe 在内的数据结构支持各种格式(包括数据库)输入输出支持时间序列Matplotlib擅长数据绘图,绘制交互式可视化图像。 提供一套和 matlab 相似的命令 API十分适合交互式绘图可以作为绘图控件嵌入 GUI其他常用工具包Seaborn:统计绘图StatsModels:统计模型scikit-learn:机器学习建立在 NumPy,SciPy 基础上通过统一接口来使用,可以迅速在数据集上实现流行的算法包含许多用于标准机器学习任务的工具,如:聚类、分类和回归等Requests:网页数据抓取Beautiful Soup:解析网页数据Flask:轻量级的 web 框架sqlite3:轻量级数据库接口Pyspark: Spark 的 Python 接口nltk:自然语言处理networkx:社交网络分析theano:深度学习 |
CopyRight 2018-2019 实验室设备网 版权所有 |