就是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。VolumeVelocityValueVariety2019/6/108数据体量巨大(Volume):百度资料表明,其新首页导航每天需要提供的数据超过1.5PB(1PB=1024TB),这些数据如果打印出来将超过5千亿张A4纸。有资料证明,到目前为止,人类生产的所有印刷材料的数据仅为200PB(不能在单个计算机上集中存储,一般需要用到分布式/云计算模式等)。数据类型多样化:现在的数据不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多种类型的数据,个性化、非结构化数据占据较大比例。大数据的4V特征处理速度快数据处理遵循“1秒定律”,可从各种类型的数据中快速获取高价值的信息价值密度低:以视频为例,几小时的视频,在不间断的监控过程中,有用的数据可能仅仅几秒。单个数据可能价值不大,但是数据整体还是有高价值的(比如一个班级大家发的微博可能没有特别大的意义,但是全国高校大学生发的微博就可以反映当代大学生思想理念)2019/6/109大数据的构成大数据=海量数据+复杂类型的数据海量交易数据:企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是结构化的、通过关系数据库进行管理和访问的静态、历史数据。通过这些数据,我们能了解过去发生了什么。大数据包括:交易数据和交互数据集在内的所有数据集海量交互数据:源于Facebook、Twitter、微博、微信及其他来源的社交媒体数据构成。它包括了呼叫详细记录、设备和传感器信息、GPS和地理定位映射数据、通过管理文件传输协议传送的海量图像文件、Web文本和点击流数据、科学信息、电子邮件等等。可以告诉我们未来会发生什么。海量数据处理:大数据的涌现已经催生出了设计用于数据密集型处理的架构。例如具有开放源码、在商品硬件群中运行的ApacheHadoop。2019/6/1010