redis系统性学习一:缓存和redis相关基础知识

redis其实用了很久了,只是一直局限于基础的使用,都是简单的命令行操作,以及简单的java集成和api调用。
对于这样一个分布式场景不可或缺的中间件,还是很有必要系统性的学习和理解一下的。

redis是什么

提到redis,很多人可能都知道这是一个缓存,并且由于支持持久化存储,也有人叫它缓存数据库。
redis一般用作缓存,但是用作缓存的却不止redis这一个,记得我刚入行的时候,用的缓存其实是memcached。
memcached和redis一样,都是基于K:V和内存的,但是不同的是,memcached的value只支持String类型,而redis的value却支持5种数据类型。同时,redis还支持本地方法,以及持久化存储。
不论是更多的数据类型,还是本地方法,都使得redis的应用场景相较memcache更广泛、更方便。

缓存的作用

缓存更多的意义应该能够理解为暂存,存的当然就是数据。
对于任何一个软件系统来说,必须是有数据才会有实际的意义,不论这个数据来源于数据采集、用户输入、静态定义、初始化导入还是网络传输。
不管是何种数据来源,大多数系统都会选择存储一定的数据,存储方式通俗的讲可能有数据库、文件、内存、缓存,但是仔细想想会发现其实应该就是两种。
数据库的持久化存储最终其实也是以文件的方式存储,只不过数据库存储数据的文件和普通文本不一样而已。
缓存其实也是基于内存的,只是通常所说的缓存基本都是基于一定中间件,例如memcached和redis,而拿java开发语言来说,如map、list、array这些容器,也能存储数据,不过是一般直接称作内存而已。
这两种存储,涉及到不同的硬件,一是硬盘,一是内存,两种不同的硬件支持的存储容量和存取速度不一样,也就直接影响了两种数据存取方式的差异。
内存更快,也就使得缓存在高性能的业务场景下必不可少了。

分布式的理解

分布式是个现在很火的概念,开头也说了redis是分布式场景下现在不可或缺的一个中间件。
那么分布式到底是什么呢,想了想,似乎不太容易一两句话说清楚。
简单的说,分布式系统就是相对于传统的单体应用,进行了一定的拆分,从而实现了多点处理或者多点部署,从架构层面加上了负载均衡。
传统的单体应用,所有的功能都在一起,高度的耦合,架构可能如下:

jiagou1

这种架构维护起来非常简单,对于java来说就是一个project,开发完了往tomcat等服务器里一扔。
但是由于数据库的操作总是涉及到磁盘的io,所以一旦用户量和请求量多了,数据库就成了系统的瓶颈,于是这种系统进一步发展为数据库集群模式,如下图:

jiagou1

那么这种架构是否就算是分布式了呢?在没有一个绝对的定义下,我觉得应该某种程度来讲就已经算了,只不过这是局部的分布式。
这时候可能就有一个疑惑,分布式和分部式,是不是一样的东西,因为乍一看起来,这就是数据库加了节点部署,可能是主从集群,可能是副本集,也可能是分片。
数据库加节点,一定程度上解决了数据库性能问题,但是这不是唯一的解决方案,另一个技术就是缓存。
本人从事软件工作也才五六年而已,因此究竟是数据库集群先出现,还是缓存技术先出现,还真不是很确定,只知道从目前的的多数系统来说,数据层面可能都是数据库集群和缓存同时存在,于是整个系统可能进一步发展为如下所示:

jiagou2

经过互联网进一步发展,网络用户越来越多,硬件性能也越来越好,再加上缓存的加入,最终数据库的瓶颈在各方面影响下,不再是瓶颈,而后台系统本身的性能以及健壮性就成了问题。
在计算机中,一个应用是一个进程,由cpu管理,一个进程本身的资源和性能肯定是有限的,当各种功能模块都在一个应用中时,性能和可用性都会互相影响,于是应用本身的多节点部署,再借助负载均衡,就演变成了新的架构模式:

jiagou3

这种架构,严格来讲只能算是部署架构,是原本的单节点应用多节点部署,再使用硬件负载均衡F5或者软件负载均衡nginx实现请求的路由转发。
这种架构,看起来,从开发层面来讲,没有太大的区别。但实际上多节点的部署必然涉及到数据的共享,从某种程度而言,这时候用到的缓存如果是redis,可能就还会使用redis保证某些数据的一致性。
这种架构一定程度上解决了大量用户和大量请求时处理不过来的问题,但是从开发和代码维护等各方面考虑,系统各功能本身的耦合性依旧太高,于是系统本身再进一步拆分,从单体应用演变成模块化的多点应用:

jiagou5

系统从单体按模块拆分成不同的应用,这时候新的问题除了数据共享之外,不同应用间的交互也是问题,可以是单纯的http,也可以是性能更好的rpc远程过程调用,从我以往经历的项目来看,都是存在的。
但是不论哪种,如果都是单纯的开发自己实现,其实还是会显得麻烦。于是进一步就出现了分布式注册中心,以及微服务这些架构,在我看来,其实就是更好的解决了应用模块化拆分,和应用间信息交互。
单体应用拆分多点应用,各模块多点部署,消息队列及缓存等中间件进一步提升系统可用性,加上各种负载均衡的路由分发,以及最后的数据分析和日志分析及运维管理,就组成了现在这种架构更加复杂的分布式架构和分布式系统。

并发和并行

说到分布式,学习redis,一开始有两个重要的概念,即并发和并行,这两个词是很有区别的。在上边的架构演进图中,其实也可以看到。
首先,有两个客户端,同时发起请求,其实这就是并发。那么顾名思义,高并发其实就是非常多的客户端在一段时间内发起大量的请求。
而并行,实际可以理解为同样的功能多点部署,同时运行,并行来处理同样的请求。

推荐文章