大数据 的5v特征知多少?
大数据是指那些超过传统 数据库 系统处理能力的数据。它的数据规模和转输速度要求很高,或者其结构不适合原本的数据库系统。为了获取大数据中的价值,我们必须选择另一种方式来处理它
大量化
大量化Volume 非结构数据的超大规模和增长,总数据的80~90% ,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍。
价值化
价值化Value 大量的不相关信息,对未来趋势与模式的可预测分析,深度复杂分析( 机器学习 ,人工智能vs传统商务智能)
多样化
多样化Variety 大数据的异构和多样化,很多不同的形式(文本 图像 视频 机器数据),无模式或者模式不明显,不连贯的语法或句义
快速化
快速化Velocity 实时分析而非批量式分析,数据输入,处理与丢弃,立竿见影而非事后见效。
真实性
真实性Veracity大数据中的内容是与真实世界中的发生息息相关的,研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程。
一般情况下,大数据是以P8 EB ZB为单位进行计量的
1PB相当于50%的全美学术研究图书馆藏书的信息内容
5EB相当于至今全世界人类所讲过的话语
1ZB如同全世界海滩沙子数量总和
1YB相当于7000位人类体内的微细胞总和
大数据技术进展,目前,大数据领域每年都会涌现出大量新的技术,成为大数据获取, 存储 ,处理分析或可视化的有效手段。大数据技术能够将大规模数据中隐藏你给的信息和知识挖掘出来,为人类社会经济活动提供依据,提高各个领域的运行效率。甚至整个社会经济的集约化程度。