Tietojen tallentaminen mittakaavassa ei ole kuin tiedoston tallentaminen kiintolevylle. Se vaatii ohjelmistopäällikköä seuraamaan kaikkia bittejä, jotka muodostavat yrityksesi tiedostot. Siellä hajautetut tallennuksenhallintapaketit, kuten Ceph ja Gluster, tulevat paikoilleen.
Ceph ja Gluster ovat molemmat järjestelmät, joita käytetään hajautetun tallennustilan hallintaan. Molempia pidetään ohjelmiston määritteleminä tallennuslaitteina, mikä tarkoittaa, että ne ovat suurelta osin laitteisto-agnostisia. He järjestävät tietosi muodostavat bitit omalla taustalla olevalla infrastruktuurillaan, mikä määrittää tämän valinnan: minkä taustakehyksen haluat tukea tietosi?
Se on päätös, jonka haluat tehdä tallentamiesi tietojen tyypin, näiden tietojen käytön ja tietojen elämisen perusteella. Ceph ja GlusterFS ovat molemmat hyviä valintoja, mutta niiden ihanteelliset sovellukset ovat hienovaraisesti erilaisia.
Objektipohjainen tallennus strukturoimattomille tiedoille: Ceph
Ceph on objektipohjainen järjestelmä, eli se hallinnoi tallennettuja tietoja objekteina eikä tiedostohierarkiana ja levittää binääritietoja klusterin yli. Vastaavia esineiden tallennusmenetelmiä Facebook käyttää kuvien tallentamiseen ja Dropbox asiakastiedostojen tallentamiseen. Yleensä objektitallennus tukee massiivista jäsentelemätöntä dataa, joten se sopii erinomaisesti laajamittaiseen tietojen tallentamiseen. Järjestelmää ylläpitää demoniverkko klusterimonitorien, metatietopalvelinten ja päivitetyn tallennustilan muodossa. Nämä yhdessä tekevät Cephistä kykenevän, mutta monimutkaisemman kuin kilpailija.
Epätavallinen objekti- ja lohkopohjainen tallennus tarkoittaa, että Ceph käyttää omia työkalujaan tallennuksen hallintaan. Tämä edellyttää, että järjestelmänvalvojat tuntevat Cephin työkalut. Cephin todellinen sisäinen toiminta voi olla vaikea ymmärtää ensi silmäyksellä. Pohjimmiltaan sinun on oltava valmis oppimaan, miten se toimii hyötyjen saamiseksi. Itsehallittu, itsensä parantava järjestelmä voi vähentää juoksevia käyttökustannuksia ajan myötä, ja Ceph voi toimia alan standardien mukaisella palvelinlaitteistolla.
Järjestelmä voi myös luoda lohkotallennustilaa, joka tarjoaa pääsyn estolaitteen kuviin, jotka voidaan poistaa ja kopioida koko klusterissa. Sovellukset voivat käyttää Ceph Object Storage -palvelua RESTful-käyttöliittymän kautta, joka tukee Amazon S3: ta ja Openstack Swift -sovellusliittymiä. Tavoitteena on korkea suorituskyky, massiivinen tallennus ja yhteensopivuus vanhan koodin kanssa.
Estä varastointi hierarkkisissa puissa: GlusterFS
GlusterFS, joka tunnetaan paremmin nimellä Gluster, on perinteisempi tiedostomyymälä. Se on helppo asentaa, ja oikein koottua koontiversiota voidaan käyttää kaikissa järjestelmissä, joissa on kansio. Joustavuus ja helppokäyttöisyys ovat järjestelmän merkittävä etu. Vaikka suorituskyky voi laajentua valtavaan kapasiteettiin, suorituskyky heikkenee nopeasti. Se soveltuu parhaiten suuriin keskimääräisiin tiedostokokoihin (yli 4 Mt) ja peräkkäiseen käyttöön. Ryhmä voi levitä fyysisiin, virtuaalisiin ja pilvipalvelimiin, mikä mahdollistaa joustavan tallennuksen virtualisoinnin.
Gluster käyttää lohkotallennusta, mikä tarkoittaa, että palanpalaa tallennetaan kytkettyjen klusterilaitteiden avoimeen tilaan. Tiedosto- ja lohkopohjainen tallennustila käyttää tiedostojärjestelmää, joka järjestää tiedostot hierarkkisiin puihin. Se yhdistää maantieteellisesti erilliset palvelimet Ethernet-verkon kautta skaalattavan rinnakkaisverkkotiedostojärjestelmän luomiseksi. Gluster on pohjimmiltaan FUSE: n ja NFS: n klusteripohjainen versio, joka tarjoaa tutun arkkitehtuurin useimmille järjestelmänvalvojille. Sen on tarkoitus olla yksinkertainen, ylläpidettävä ja laajasti käytettävissä, mutta sillä ei ole nopeutta, jota Ceph voi tarjota oikeissa olosuhteissa.
Johtopäätös
Ceph soveltuu parhaiten strukturoimattoman tiedon nopeaan saatavuuteen, joka muodostaa valtaosan tiedostoista maailmassa. Gluster on parempi peräkkäiseen tiedonsiirtoon, kuten videoiden suoratoistoon, tai sovelluksiin, joissa nopeus ei ole niin tärkeä, kuten varmuuskopiointi.
Mitä tiedostojen tallennusjärjestelmää käytät?