数据分析师的极简入门书籍 您所在的位置:网站首页 excel数据处理分类汇总与数据透视表的区别 数据分析师的极简入门书籍

数据分析师的极简入门书籍

2023-05-29 23:41| 来源: 网络整理| 查看: 265

1.背景

因为之前知乎的回答,超级菜鸟怎么学习数据分析?,很多朋友咨询数据分析入门的书籍,这里简单整理了下。

关于入行数分,2021年新回答,覆盖更全面,如何快速成为数据分析师?建议收藏。

2.导读阅读对象: 入门或转行数据分析的小白阅读时间: 5分钟

最高效的学习是站在别人的肩膀上,快速了解。先扔一个初级入门数分训练营,1分钱,快速了解数据分析如何赋能业务,高手绕行,小白查收~

3.数据分析入门资料方法、思维《谁说菜鸟不会数据分析》系列,算是大白话了,通俗易懂,并且也实例讲解了数据分析一些常用方法《数据挖掘与数据化运营实战: 思路、方法、技巧与应用》卢辉,这本书将了常用的挖掘方法,比如聚类,主成分分析,因子分析,关联规则等,同时还列举了很多阿里实战案例,我转行的时候买的,没有公式,后面入行后才感觉,作者写的真好,都是实践后的干货总结数据分析和拆解MECE,这个肯定要看麦肯锡资深顾问,巴巴拉·明托的金字塔原理,它是一项层次性、结构化的思考、沟通技术,可以用于结构化的说话与写作过程。Excel貌似自己没有专门读一本Excel书籍, 都是遇到问题网上查询如果不是特别充足的时间,也不建议买一厚本书啃,除非这本书你能花1-2天读完,而且干货较多我暂时整理下数据分析师常用的一部分功能,放到Excel极简入门文件, 提取码:zkrx, 可以下载下来花10分钟,快速了解下,以后遇到新的需求你再google即可(我用的是Linux系统,不能安装MS Office,所以暂时用WPS Office代替,大同小异, 实际上我最近两年很少用Windows了)SQLW3school SQL 教程(数据分析主要学习select即可, 其他简单看下即可,没时间就不看,以后用到再学)李天生SQL Server2008教程(讲得特别接地气, 2-3分钟一个case, 同样建议select部分要精通,其他看自己情况)以上感觉了解基本语法足够了,要真正精通sql,还是需要大量的实践书籍:《Mysql数据库从入门到精通》,粗粗看过这本,对数据分析师来说,可能仅小部分会用上,毕竟讲得是Mysql所有的操作包括权限控制,事务处理,这些一般后端开发或者DBA才会用到,所以感觉也可以不读针对小白同学,这里重点说明下: sql是一种语言, 它用来和数据库进行交互,进行操作数据的增删改查,而数据库是有多种的,比如mysql, oracle, sql server, hive等,每种数据库适配的sql语言基本相同,所以在学习的时候,选择其中一种数据库进行操作学习即可,mysql是目前也是互联网采用最广泛的数据库,oracle/sql server银行等传统企业用的比较多,而hive是集成在分布式文件系统hadoop之上的数据库,俗称"大数据",主要用来存储用户访问的行为日志。我们学习sql这个语言语法的话,选择mysql进行学习即可,其他大同小异

所以,针对不同知识背景的同学,输入不同的学习目标。

我根据大家对数据相关工具的掌握程度,将学SQL的同学划分为三类。

其中,数据相关工具包括: Excel、SQL、Shell、Python等

第一类群体: 数据小白

我定义的数据小白,是这样的:

Excel: 基本功能会用,对数据有点概念, 比如:能对某列进行排序、筛选能对某列求和、求平均值知道透视表,但不熟,比如:会选中表格内容生成透视表不懂行、列、值如何拖拽满足统计要求SQL\Shell\Python: 完全没接触过学习目标: 能看的懂SQL,并能简单使用SQL统计数据

我希望小白同学,学习课程的下面模块:

第一部分: SQL的应用场景考核目标一: 什么是SQL?考核目标二: SQL能干哪些事儿?考核目标三: 互联网最常用数据库,说两种。第二部分: SQL的基础语法考核目标一: 用SQL来实现Excel的基础功能: 排序、筛选、去重考核目标二: 用SQL来实现Excel的汇聚功能: 求和、求平均、求最大/最小值考核目标三: 给出一个复杂SQL脚本模板,并能简单修改完成统计第二类群体: 表哥表姐

我定义的表哥表姐:

每天用Excel完成各种统计分析,对Excel下面数据功能极精通基础功能: 列排序、筛选、去重、求和、求平均高级功能: 透视表行列值汇总、占比汇总、过滤、排序常用函数:数值函数: SUM\AVG\MAX\MIN\FLOOR\COUNT逻辑函数: IF\IFERROR字符函数: LEFT\RIGHT\MID\CONCATENATE\VALUE时间函数: YEAR\MONTH\DAY\DATE高级函数: VLOOKUPSQL: 了解过,知道是干啥用的,甚至搜过相关文章,因为没数据库环境,一直没动手练过Shell\Python: 完全没接触过,以后也不准备投入时间学习学习SQL目的: 以Excel+业务为主,SQL作为辅助工具,希望能从数据库提取和统计数据,然后导入Excel继续做表格

我希望表哥表姐,重点学习下面模块, 考核深度增加:

第二部分: SQL的基础语法(新增考核点已标黄)考核目标一: 用SQL来实现Excel的基础功能: 排序、筛选、去重考核目标二: 用SQL来实现Excel的汇聚功能: 求和、求平均、求最大/最小值考核目标三: 给出一个复杂SQL脚本模板,并能简单修改完成统计考核目标四: 举例常见错误写法,可根据运行错误提示,能找到原因并修改第三部分: SQL的多表关联考核目标一: 理解表关联的背景知识点,笛卡尔积,并举例说明考核目标二: 理解left join/right join/full区别考核目标三: 独自完成两表关联查询的测试题第三类群体: 准数据民工

我定义的准数据民工:

希望做数据工作,还没有实战经历,正在摸索搭建数据环境,学习数据的工具和语言。SQL已完成一定基础语法学习SQL/Shell/Python都刚刚开始接触学习Excel用的不太多,不太熟悉只会基础排序、筛选的使用,透视和高级函数很少缺少业务场景的数据需求,不知道工具怎么服务于业务分析学习目标: 了解SQL高级且常用的场景,学会拆解业务需求为SQL脚本

我希望准数据民工,重点学习下面模块:

第二部分: SQL的基础语法跳转到第二部分测试题目部分,如果能轻松作答,则可以跳过基础语法阶段第三部分: SQL的多表关联(加深考核点已标黄)考核目标一: 理解表关联的背景知识点,笛卡尔积,并举例说明考核目标二: 理解left join/right join/full区别考核目标三: 能独立完成三张甚至更多表的关联查询第四部分: 高级函数用法考核目标一: 日期转换、加减测试题考核目标二: hive sql分组排序函数row_number考核目标三: hive sql字符串聚合函数concat_ws\group_concat考核目标四: hive sql的json格式解析第五部分: 如何将业务需求拆解为SQL脚本考核目标一: 需求沟通,明确数据需求是否合理,是否能做考核目标二: 将需求拆解到业务表中,并列出待统计的数据指标Shell数据分析师,对于shell命令的了解,仅限于基本命令的使用和数据的处理,对于shell的开发不做特别要求,具体看个人兴趣和时间成本则需投入鸟哥的Linux私房菜,当然也有对于的书,价格比较贵,不过物有所值,书本是对整个Linux系统介绍,比较全面,这本书不是专门为数据分析师准备的,很大开发和运维都会读这本书,如果只是数据分析使用,完全没必要全读,主要读shell部分就可以了上面书也可以不买,直接网上了解常用shell命令也可以了,尤其对于文科生转化做数据分析,我感觉除非兴趣,完全么有必要了解太深入,我们学习的目的毕竟是使用Python廖雪峰Python教程,Python语言语法的入门, 这个绝对是经典了, 通俗易懂,对于数据分析师,尤其是刚入门的小白,只读到该教程的"面向对象高级编程"以前即可Python数据分析第三方数据分析: pandas, numpy绘图包: matplotlib, seaborn机器学习: sklearn, tensorflow等书籍:《利用Python进行数据分析》, 主要介绍如何用pandas进行数据分析,也会讲到numpy,以及matplotlib和pandas绘图, 这本书确实写的很好,但是小白上来阅读可能会一头水雾,所以可以退而求其次,10 Mintutes to pandas, 当然这个10分钟是搞不定的哈, 不过常用的pandas在里面,另外panda要精通也需要大量的练习,遇到问题google或者pandas官网文档查询即可,注意这些文档不需要一页页阅读,用到那个学习那个就中《集体智慧编程》,讲了经典的数据挖掘算法,Python代码,我是刚入门的时候读过,这本书适合有一定Python基础的同学阅读,可能刚入门的同学,还是聚焦于pandas的熟练使用会比较好,以后入行后有空再读,现在信息大爆炸,即使是好东西,我们也要选择性的获取,珍惜自己的时间《机器学习》周志华, 这本太经典了,我看了2遍,虽然并没有进行公式推导,但也收获蛮大,有空会再读。这本书入门同学尤其是偏业务而非技术的分析师可以不用太着急读,开始的精力先聚焦到数据思维,业务,excel,sql, 如果有富余精力,再学习shell, python,一步一步来哈实战实战练习是少不了的,没有学习环境和练习数据,我暂时无私奉献一波,纯攒人品。提供大家的是Linux学习环境和Mysql数据库及练习数据,基本够用,直接加我微信(ITlooker),给你云端学习的账号配合以上我提供的数据学习环境,数据分析破冰任务,有时间可以尝试下:SQL提数练习大白话shell命令系列:文件查看篇大白话shell命令系列:数据统计(一)大白话shell命令awk:数据统计(二)

知易行难,建议还是了解下,实际厂里是怎么数据赋能业务的,先扔一个数分训练营,了解数据分析如何赋能业务,高手绕行,小白查收~

关于经哥

帝都北五环外,码农集聚村,回龙观的一位数据老民工,欢迎加v唠嗑、吐槽

2019年开始写写数据民工那些大白话,定期带来一些数据民工专属干货,如果你有其他行业的数据干货, 欢迎也晒给大家伙儿!集思广益,普惠于民工汪洋大世界!!

人走赞留,江湖再见,蟹蟹!

热门文章推荐

入门篇

快速入坑数据分析师? | 超级菜鸟学习数据分析?

数据分析师干啥活儿 | 数据分析师极简入门书籍

经哥自建SQL练习网站 | sql学到什么程度?

技能篇

数据处理技巧 | 设计和评估 ABTest

数据分析师的类型 | 公司从0搭建BI系统

SQL刷题, 完爆牛客网 | SQL提数: 数据分析第一步

shell命令篇:文件查看 | 数据统计 | awk:数据统计

Python绘图篇: Matplotlib | Pandas | Seaborn

案例篇

短视频留存分析 | 社区内容生态建设分析 | 付费自习室的收入预估 | 相亲问题的数据量化

优惠券发放背后的逻辑 | 因果分析: 双重差分模型

网站日志数据分析实战 | 网站被攻击的数据分析!| 大白话Kaggle入门 : Titanic篇

思维篇

数据波动的异常分析 | 订单下降该如何排查 | 场景思维,咱要有这个习惯 | 数据需求处理场景

求职篇

写简历,看这篇就够 | 数据面试,这样准备就可

互联网10大岗位 | 互联网就业大盘 | 没数据经验别慌

数据分析师岗位分类 | 数据分析岗的迷茫?

1400位同学的数据分析入坑问答 | 求职咨询的数据小白 | 前端工程师转行数据分析的咨询 | 关于数据分析找工作咨询回复

资料篇

最全数据分析学习资料 | 行业报告数据源大全



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有