p分布式运行程序。Р在云计算系统的后端架设了大量的服务器,这些服务器分布在各个地方,负责不同的地域和服务,结构比较复杂。如何将如此大量的服务器有效地组织起来是保证云计算系统高效稳定运行关键问题之一。РHadoop是一个在集群上运行大型数据库处理应用程序的开放式源代码框架。它支持通过Google的MapReduce编程范例来创建并执行的应用程序,在很多大型网站上都已经得到了应用,可以说是目前最为广泛应用的开源云计算软件平台。Hadoop平台最大的优点就是实现了并行对平台程序设计人员的透明处理,应用开发者可以像开发普通程序一样来开发云计算的应用系统,底层会自动完成并行化。Р本文主要以云计算与Hadoop为主题进行扩展研究,涉及下面三个方面的内容:Р1).广泛查阅资料的基础上,对云计算的背景以及国内外的发展现状进行了一个很全面的了解。云计算的基本的概念以及发展前期其他计算模式的历程,在这十年间的历程中云计算逐渐走向应用,它的特点和优势,对我们现今生活方式的改变起了很大的作用。云计算的普遍应用能更加使资源的利用更合理更节约更安全。其中云计算的发展至今有许多的相应的技术,它的分布式编程模式的思想,还有数据存储和管理,其中虚拟化技术更是为云计算的发展带来了铺垫。Р2).本文的下一部分对云计算的一个实现平台Hadoop加以研究,这是一个开放源代码的平台,其思想来源于Google的云计算平台,它的出现使我们分布式编程实现成为了可能,也使云计算更加的普及到商业中来。这部分对Hadoop的文件系统HDFS做了一些介绍,还有MapReduce相关的知识。?Hadoop是怎么构架以及实现的原理?通过与GFS 文件系统的比较更深入了解分布式系统的构架,最后详细的介绍了Hadoop API 的使用,API 中的包,MapReduce框架结构,以便于更详细的了解Hadoop做任务的原理,编出更好的程序。