B2011年,全球数据量为1.8ZB数据换算单位1B(byte字节)=8bit1KB(Kilobyte千字节)=1024B,1MB(Megabyte兆字节简称“兆”)=1024KB,1GB(Gigabyte吉字节又称“千兆”)=1024MB,1TB(Terabyte万亿字节太字节)=1024GB,1PB(Petabyte千万亿字节拍字节)=1024TB,1EB(Exabyte百亿亿字节艾字节)=1024PB,1ZB(Zettabyte十万亿亿字节泽字节)=1024EB,1YB(Yottabyte一亿亿亿字节尧字节)=1024ZB,1BB(Brontobyte一千亿亿亿字节)=1024YB大数据多样性Variety速度Velocity价值Value体量Volume存储量大计算量大非结构化数据占90%来源多格式多(文本、图像、视频、机器数据)增长速度快处理速度要求快实时分析而非批量分析可预测分析深度复杂分析(机器学习、人工智能4V特性:花样多、体量大、速度快、价值高数据来自哪儿?互联网公司(BAT等)通信运营商(移动、联通、电信)金融系统每年产生数据达数十PB保险系统数据量也接近PB级别国家电网采集获得的数据总量就上10个PB级别整个医疗卫生行业一年能够保存下来的数据就可达到数百PB数据源百度,2013数据总量接近1000PB,70%以上的搜索市场份额坐拥庞大的搜索数据;阿里,目前保存的数据量为近百PB,拥有90%以上的电商数据腾讯,总数据量压缩后在100PB,大量社交、游戏等文本、音频、视频类数据用户上网记录、通话、信息、地理位置运营商拥有的数据数量都在10PB以上年度用户数据增长约数十PB北京50万个监控摄像头,每年保存下来的数据在数百PB以上中国气象局保存的数据约4~5PB,每年约增数百个TB航班往返一次能产生数据就达到TB级别金融、酒店、医疗、电力等行业物联网、传感器等