分布式系统·作业(一)

在分布式系统中,为什么有时难以隐藏故障的发生以及故障恢复过程

完全隐藏网络和节点的失效是不可能的。通常,要探测一个服务器是停止服务还是该服务器的反应变慢是不可能的,一个系统可能在服务响应变慢的时候报告服务停止,从而不能区分失效和性能变慢的节点,也不能确定系统失效之前的操作是什么。因此,故障发生和恢复的过程是难以掩藏的。

给出一些体现分布式系统可扩展性的案例,并解释

在一定程度内的负载增长不会影响应用预期表现的能力,或者说增加分布式系统中计算节点的数量并进行一些小的调整,就可以得到接近于线性增加的负载能力。比较典型的案例有双十一时的购物网站服务器集群、春运时的购票网站,都会增加服务器集群中的机器,以应对爆炸增长的访问需求。

列举应用程序之间的通信方式,并简单解释

文件共享

两个进程通过对文件的读写来通信,通常是一个应用向文件内写数据,另一个应用通过共享的方式打开文件并读取其中内容。

剪切板

应用可以读写的一块区域,当有新的数据放在剪贴板上时,则先前的数据就会被冲掉。

管道

管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系(父子进程)的进程间使用。另外管道传送的是无格式的字节流,并且管道缓冲区的大小是有限的(管道缓冲区存在于内存中,在管道创建时,为缓冲区分配一个页面大小)。

有名管道 (FIFO)

有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。

信号(Signal)

信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。

信号量(Semaphore)

信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。

消息队列(Message Queue)

消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。

共享内存(Shared Memory)

共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号量,配合使用,来实现进程间的同步和通信。

套接字(Socket)

套解口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同主机间的进程通信。