说大数据的技术还是要先提Google,Google 新三辆马车,Spanner, F1, Dremel
Spanner:高可扩展、多版本、全球分布式外加同步复制特性的谷歌内部数据库,支持外部一致性的分布式事务;设计目标是横跨全球上百个数据中心,覆盖百万台服务器,包含万亿条行记录!(Google就是这么霸气^-^)
F1: 构建于Spanner之上,在利用Spanner的丰富特性基础之上,还提供分布式SQL、事务一致性的二级索引等功能,在AdWords广告业务上成功代替了之前老旧的手工MySQL Shard方案。
Dremel: 一种用来分析信息的方法,它可以在数以千计的服务器上运行,类似使用SQL语言,能以极快的速度处理网络规模的海量数据(PB数量级),只需几秒钟时间就能完成。
Cassandra
大数据架构中,Cassandra的主要作用就是存储结构化数据。DataStax的Cassandra是一种面向列的数据库,它通过分布式架构提供高可用性及耐用性的服务。它实现了超大规模的集群,并提供一种称作“最终一致性”的一致性类型,这意味着在任何时刻,在不同服务器中的相同数据库条目可以有不同的值。
SQL on Hadoop
开源社区业出现了很多 SQL-on-Hadoop的项目,着眼跟一些商业的数据仓库系统竞争。包括Apache Hive, Spark SQL, Cloudera Impala, Hortonworks Stinger, Facebook Presto, Apache Tajo,Apache Drill。有些是基于Google Dremel设计。
Impala
Cloudera公司主导开发的新型查询系统,它提供SQL语义,能够查询存储在Hadoop的HDFS和HBase中的PB级大数据,号称比Hive快5-10倍,但最近被Spark的风头给罩住了,大家还是更倾向于后者。
Drill
Apache社区类似于Dremel的开源版本—Drill。一个专为互动分析大型数据集的分布式系统。
Druid在大数据集之上做实时统计分析而设计的开源数据存储。这个系统集合了一个面向列存储的层,一个分布式、shared-nothing的架构,和一个高级的索引结构,来达成在秒级以内对十亿行级别的表进行任意的探索分析。
Berkeley Data Analytics Stack
上面说道Spark,在Berkeley AMP lab 中有个更宏伟的蓝图,就是BDAS,里面有很多明星项目,除了Spark,还包括:
Mesos:一个分布式环境的资源管理平台,它使得Hadoop、MPI、Spark作业在统一资源管理环境下执行。它对Hadoop2.0支持很好。Twitter,Coursera都在使用。
Tachyon:是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架中进行可靠的共享,就像Spark和MapReduce那样。项目发起人李浩源说目前发展非常快,甚至比Spark当时还要惊人,已经成立创业公司Tachyon Nexus.
BlinkDB:也很有意思,在海量数据上运行交互式 SQL 查询的大规模并行查询引擎。它允许用户通过权衡数据精度来提升查询响应时间,其数据的精度被控制在允许的误差范围内。
Cloudera
http://www.bubuko.com/infodetail-1307351.html
相关推荐
大数据云技术文档大数据云技术文档大数据云技术文档大数据云技术文档大数据云技术文档大数据云技术文档
大数据概述大数据相关技术大数据与云计算完整版资料.pptx
福建师范大学精品大数据导论课程系列 (3.1.1)--2.1 《大数据相关技术基础(1)》PPT.pdf 福建师范大学精品大数据导论课程系列 (3.2.1)--2.2 《大数据相关技术基础(2)》PPT.pdf 福建师范大学精品大数据导论课程系列 ...
大数据很好的资料,欢迎大家共享资源,共同进步!
大数据平台技术框架选型分析,是硬件软件的选择,组件的选型
福建师范大学精品大数据导论课程系列 (3.1.1)--2.1 《大数据相关技术基础(1)》PPT.pdf 福建师范大学精品大数据导论课程系列 (3.2.1)--2.2 《大数据相关技术基础(2)》PPT.pdf 福建师范大学精品大数据导论课程系列 ...
福建师范大学精品大数据导论课程系列 (3.1.1)--2.1 《大数据相关技术基础(1)》PPT.pdf 福建师范大学精品大数据导论课程系列 (3.2.1)--2.2 《大数据相关技术基础(2)》PPT.pdf 福建师范大学精品大数据导论课程系列 ...
大数据相关技术发展趋势.docx
大数据讲演PPT, 包含大数据相关技术介绍,大数据关键技术,大数据与云计算之间的关系等等。 适于关于大数据的讲演和大数据初学者
对大数据相关技术的研究和实践.zip
电影数据集,用于训练模型或是学习大数据相关技术
大数据云计算技术 Hadoop集群监控与Hive高可用-暴风影音技术团队分享(共17页).ppt 大数据云计算技术 Hadoop应用浅析(共16页).pptx 大数据云计算技术 Hadoop运维杂记(共21页).pptx 大数据云计算技术 暴风集团...
一共四十多天课程,详细教学,从基础进行授课。大小修改日期 08.文件常用操作命令.avi 450.9M2018-07-20 10:45 05.vmware虚拟网络的配置介绍.avi 252.8M2018-07-20 10:45 01.基础部分课程介绍.avi ...
福建师范大学精品大数据导论课程系列 (3.3.1)--2.3 《大数据相关技术基础(3)》PPT.rar
福建师范大学精品大数据导论课程系列 (3.2.1)--2.2 《大数据相关技术基础(2)》PPT.rar
福建师范大学精品大数据导论课程系列 (3.1.1)--2.1 《大数据相关技术基础(1)》PPT.rar
课程报告课程报告可以完成以下内容三者之一:1、自学一项大数据相关技术,按照本课程实验指导格式撰写一份实验教程。3、解决某项大数据/人工智能相关问题,对研究成果进
A、在数据基础上倾向于全体数据而不是抽样数据 B、在分析方法上更注重相关分析而不是因果分析 C、在分析效果上更追究效率而不是绝对精确 D、在数据规模上强调相对数据而不是绝对数据 22大数据技术的战略意义不在于...
本周为软件学院的大数据方向课程第一周,班级人数总共为38人,本周课程实训过程内容主要如下: 一、实训内容 根据OBE(成功导向)的教学理念,深入聚焦学生解决复杂工程问题能力的培养,本周主要为实训学员讲解了软件...
3.1 大数据相关技术基础(1) 3.2 大数据相关技术基础(2) 3.3 大数据相关技术基础(3) 4.1 大数据来源 4.2 大数据采集 4.3 大数据预处理 4.4 大数据集成 5.1 hadoop简介之一 5.2 hadoop简介之二 5.3 HDFS的简要介绍 5.4...