Temat: Cloud Storage - coś co działa podobnie do vSAN z firmy...
Musisz podejść do tematu projektowo, dobór rozwiązania jest uzależniony od tego co masz i co ewentualnie możesz dokupić, a to skorelować z rzeczywistymi potrzebami.
CEPH rekomenduje bodajże 7 nodów do prawidłowej pracy, funkcjonalnie te usługi możesz upchnąć na 3. W przypadku DRBD masz minimum 3 nody (de facto, zawsze powinieneś mieć minimum 3 nody, żeby uchronić się przed split brain) ale bodajże maks 16 nodów i na chwilę obecną zbudujesz na tym tylko raid1.
Nie patrz też na warstwę klastrową z punktu widzenia klienta, to jak to wystawisz klientowi uzależnione jest tylko od docelowej wydajność i ilości warstw pośrednich. Klaster możesz mieć na ceph, hadoop, gluster, drbd, zfs+aoe itp, a klientowi w tym przypadku esxi możesz to wystawić po nfs, iscsi czy czym czymś co będzie działało Ci sprawnie i na co ewentualne fundusze Ci pozwolą.
VIP nie musi wynikać z usługi rozproszonego storage, VIP możesz zbudować na ucarp, keppalive itp, plus np: monit który ewentualnie podniesie lub zrestartuje padniętą usługę storage.
Możliwości jest dużo, wszystko można złożyć z istniejących sprawdzonych rozwiązań, tylko trzeba najpierw doprze oszacować potrzeby i możliwości, później poprzeć to minimalnym projektem, pod który będzie dobór narzędzi. Sporo można podpatrzeć u tych co wiedzą lepiej :) to polecam np: OpenStack który cały jest zbudowany na tym co open :)
W kwestii GlusterFS nie słyszałem żadnej złej opinii i nigdy nie miałem z nim problemów, jeśli problemy były to wynikały ze sprzętu, sieci itp, nigdy z samej usługi.
Generalnie rozwiązań, jest na prawdę sporo i uszytych na każdą miarę, krótka lista z moich notatek:
Ceph - Distributed object store and file system.
DRBD - Distributed Replicated Block Device.
LeoFS - Unstructured object/data storage and a highly available, distributed, eventually consistent storage system.
GlusterFS - Scale-out network-attached storage file system.
HDFS - Distributed, scalable, and portable file-system written in Java for the Hadoop framework.
Lustre - A type of parallel distributed file system, generally used for large-scale cluster computing.
MooseFS - Fault tolerant, network distributed file system.
MogileFS - Application level, network distributed file system.
OpenAFS - Distributed network file system with read-only replicas and multi-OS support.
TahoeLAFS - secure, decentralized, fault-tolerant, peer-to-peer distributed data store and distributed file system.
XtreemFS - XtreemFS is a fault-tolerant distributed file system for all storage needs.
pNFS - pNFS removes the performance bottleneck in traditional NAS systems by allowing the compute clients to read and write data directly and in parallel, to and from the physical storage devices.
LizardFS - LizardFS to otwarty rozproszony system plików na licencji GPLv3, służący do zarządznia i rozpraszania danych pomiędzy wieloma fizycznymi lokalizacjami
OrangeFS - OrangeFS is an open source parallel file system, the next generation of Parallel Virtual File System.