Cassandra -去中心化的结构化存储系统 (2)

1.       介绍 (INCRODUCTION)

Facebook是最大的社交网络平台,在峰值的时候,他可以通过部署在世界各地很多数据中心的几万台服务器为几亿用户提供服务。Facebook的平台,为满足系统性能,可靠性和效率,为满足业务上的持续增长的扩展性,对运维提出了严格的需求。处理具有千台的节点规模的基础架构的故障,已经成为我们工作的常态。另外还有很多小的节点和网络组件,在任何时候也都会发生故障。因此软件系统在设计的时候,要把这些节点故障当成常态,而不是例外来处理。 为了应对上述可靠性和扩展性挑战,Facebook开发了Cassandra.

Cassandra采用了一系列众所周知的技术,来达到扩展性和可用性。 Cassandra 被设计成收件箱搜索的存储部分。用户通过收件箱搜索功能,来完成日常收件箱搜索操作。在Facebook,这意味着系统要能够应对非常高的写吞吐量,每天会有数十亿的写请求,这个数字还在随着用户的增长而不停增长。因为Facebook的数据中心,分布在不同的地域为用户提供服务,因此在IDC之间复制数据,是降低搜索延迟的关键。收件箱搜索在2008年6月上线,当时有1亿用户,到今天(论文发表时间),Facebook有2.5亿用户,Cassandra仍旧能够满足需求。 Cassandra目前为Facebook的多个服务提供后端存储支持。

这个论文按照如下结构组织. 第二章描述了相关的工作,都是在我们的设计中非常重要的方面。第三章详细阐述了数据结构。第四章简要介绍了客户端API。 第五章披露了分布算法和系统设计细节。第六章详细介绍了如何搭建Cassandra系统和系统性能调优。 第六章第一节介绍了Facebook平台如何使用Cassandra 。最后第七章总结了Cassandra的后续工作。

Leave a Reply

Your email address will not be published. Required fields are marked *