特征大数典型据的四个
大数据是大数指“无法用现有软件工具提取、存储、个典搜索、型特共享、大数分析和处理的个典海量复杂数据集。”业界通常用四个V(即成交量、型特品种、价值、速度)来概括大数据的特征。kag 一是庞大的数据量。到目前为止,人类生产的所有印刷材料的数据量为200PB(1PB=210TB),而人类在历史上所说的所有文字的数据量约为5EB(1EB=210PB)。目前典型的个人电脑硬盘容量为TB,而一些大企业的数据量接近EB。kag 第二,数据类型很多。这种多样性还允许将数据分为结构化数据和非结构化数据。与过去易于存储的结构化数据相比,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等。这些各种类型的数据对数据处理能力提出了更高的要求。kag 第三,价值密度低。该值与数据总量成反比。以视频为例。对于一个小时的视频,在连续监控中,有用的数据可能只有一两秒钟。如何通过强大的机器算法更快地完成数据的价值净化,成为大数据背景下亟待解决的问题。kag 第四,处理速度快。这是大数据区别于传统数据挖掘的最显著特征。根据IDC《数字宇宙》报告,预计2020年全球数据使用量将达到35.2ZB。面对如此海量的数据,数据处理的效率是一个企业的生命。kag |
-
中国消费者协会发布消费提示:未成年人“吃谷”谨防消费陷阱
2535 -
“神秘买家”网上点单 厦门网红店45批次食品抽检全合格
2628 -
2月2日意大利西西里疫情最新消息
362 -
中国食药促进会消毒专业委员会组织的七项团体标准技术审查会顺利召开
735 -
49家拟赴境外IPO企业已提交备案申请 目前监管层鼓励渠道畅通
1781 -
降低异丙胺单耗的有效措施
638 -
产共轭亚油酸菌株的筛选及其发酵性质研究(三)
1165 -
我为群众办实事|辽宁锦州:深入社区开展消费维权宣传活动
906 -
清明小长假出行,文旅部提醒广大游客注意这四点
1246 -
蛋白质氧化和酶对草鱼重组鱼肉品质及体外模拟消化的影响(一)
1021