【大数据导论】 | 您所在的位置:网站首页 › 导论与概论的区别是什么 › 【大数据导论】 |
一、大数据的概念
大数据的4个特点,包含4个层面,简称“4V”: 数据量大(Volume)数据类型繁多(Variety)处理数据快(Velocity)价值密度低(Value)(1)数据量大 根据IDC发布报告,人类社会数据每年50%的速度,每两年就增长一倍。 人类在最近两年产生的数据量相当于之前产生的全部数据量到了2020年,全球将会有35ZB数据量数据存储单位之间的换算关系 单位换算关系Byte(字节)1Byte=8bitKB(Kilobyte,千字节)1KB=1024ByteMB(Megabyte,兆字节)1MB=1024KBGB(Gigabyte,吉字节)1GB=1024MBTB(Trillionbyte,太字节)1TB=1024GBPB(Petabyte,拍字节)1PB=1024TBEB(Exabyte,艾字节) 1EB=1024PBZB(Zettabyte,泽字节)1ZB=1024EB就拿拍照来说,早期我们只能每一分钟拍一张,随着照相设备的不断改进,处理速度越来越快,发展到后来,就可以1秒钟拍1张,而当有一天发展到1秒钟可以拍10张以后,就产生了电影。当数量的增长实现质变时,就由一张照片变成了一部电影。同样的量变到质变的过程,也会发生在数据量的增加过程之中。 (2)数据类型繁多 如:消费者大数据、金融大数据、医疗大数据、城市大数据、工业大数据等。 大数据的数据量非常大。总体而言可以分为两大类: 结构化数据 主要指存储在关系数据库中的数据非结构化数据 包括邮件、音频、视频、位置信息、链接信息、手机呼叫信息、网络日志等传统的OLAP(On-Line Analytical Processing)分析和商务智能工具大都面向结构化数据,而在大数据时代,用户友好的、支持非结构化数据分析的商业软件也将迎来广阔的市场空间。 (3)处理速度快 一秒定律: (4)价值密度低 例如:在一座城市,安装了上百万个监控摄像头,每天都在拍摄,每天每时每刻都在生产相关的数据,这数据只要没有意外事件发生,连续不断产生的数据都是没有任何价值的,但当发生事故等意外情况时,也就只有记录了事件过程的那一小段视频有价值。 为了获得发生事故等意外情况时的那一段有价值的视频,我们不得不投入大量的资金购买监控设备、网络设备、存储设备,耗费大量的电能和存储空间,来保存摄像头连续不断产生的监控数据。从这点来看,大数据的价值密度是较低的。 二、大数据的影响 2.1 大数据对科学研究的影响大数据对科学研究的影响先后经历了实验科学、理论科学、计算科学、数据密集型科学四种范式。
(1)第一种范式——实验 (2)第二种范式——理论 (3)第三种范式——计算 (4)第四种范式——数据 大数据时代以数据为中心 在第三种研究范式中,一般是先提出可能的理论,在搜集数据,然后通过计算来验证 对于第四种范式,则是先有了大量已知数据,然后通过计算得出之前未知理论 2.2 大数据对社会发展的影响 大数据决策逐渐成为一种新的决策方式大数据成为提升国家治理能力的新途径大数据应用有力促进了信息技术与各行业的深度融合大数据开发大大推动了新技术和新应用的不断涌现 2.3 大数据对就业市场的影响大数据的兴起使得数据科学家成为热门职业。互联网企业和零售、金融类企业都在积极争夺大数据人才,数据科学家成为大数据时代最紧缺的人才。 2.4 大数据对人才培养的影响 计算机技术 计算机技术相关人才,包括平台搭建和应用开发统计学人才 统计学相关人才,包括数学、建模、算法业务人才 要具有一定的专业领域知识,只有明白目标领域知识的人才能了解数据的意义以及指导数据分析的方向并判断数据分析结果的可信性 |
CopyRight 2018-2019 实验室设备网 版权所有 |