La desduplicació de dades és una tecnologia d'emmagatzematge popular i popular que optimitza la capacitat d'emmagatzematge. Elimina les dades redundants eliminant les dades duplicades del conjunt de dades, deixant només una còpia. Com es mostra a la figura següent. Aquesta tecnologia pot reduir considerablement la necessitat d'emmagatzematge físic. espai per satisfer la demanda creixent d'emmagatzematge de dades. La tecnologia deduplicada pot aportar molts beneficis pràctics, incloent-hi principalment els aspectes següents:
(1) | Complir els requisits de ROI (retorn de la inversió)/TCO (cost total de propietat); |
(2) | El ràpid creixement de les dades es pot controlar de manera eficaç; |
(3) | Augmentar l'espai d'emmagatzematge efectiu i millorar l'eficiència de l'emmagatzematge; |
(4) | Estalvieu el cost total d'emmagatzematge i el cost de gestió; |
(5) | Estalviar l'ample de banda de la xarxa de transmissió de dades; |
(6) | Estalvieu costos d'operació i manteniment, com ara espai, font d'alimentació i refrigeració. |
La tecnologia de deduplicació s'utilitza àmpliament en sistemes de còpia de seguretat i arxiu de dades, perquè hi ha moltes dades duplicades després de múltiples còpies de seguretat de dades, la qual cosa és molt adequada per a aquesta tecnologia. De fet, la tecnologia de deduplicació es pot utilitzar en moltes situacions, incloses les dades en línia, dades properes a la línia i sistemes d'emmagatzematge de dades fora de línia. Es pot implementar en sistemes de fitxers, gestors de volums, NAS i sans. Dedupe també es pot utilitzar per a la recuperació de dades, la transmissió i la sincronització de dades, ja que es pot utilitzar una tecnologia de compressió de dades per a l'empaquetament de dades. La tecnologia Dedupe pot ajudar moltes aplicacions a reduir emmagatzematge de dades, estalvieu ample de banda de xarxa, milloreu l'eficiència de l'emmagatzematge, reduïu la finestra de còpia de seguretat i estalvieu costos.
La deduplicació té dues dimensions principals: les ràtios de desduplicació i el rendiment. El rendiment de la deduplicació depèn de la tecnologia d'implementació específica, mentre que la taxa de deduplicació està determinada per les característiques de les dades en si i els patrons d'aplicació, tal com es mostra a la taula següent. Els proveïdors d'emmagatzematge informen actualment de taxes de deduplicació que varien de 20:1 a 500:1.
Alta taxa de deduplicació | Baixa taxa de deduplicació |
Dades creades per l'usuari | Dades del món natural |
Baixa taxa de canvi de dades | Alta taxa de canvi de dades |
Dades de referència, dades inactives | Dades actives |
Aplicació de baixa taxa de canvi de dades | Aplicació d'alta velocitat de canvi de dades |
Còpia de seguretat de dades completa | Còpia de seguretat de dades incremental |
Emmagatzematge de dades a llarg termini | Emmagatzematge de dades a curt termini |
Àmplia gamma d'aplicacions de dades | Petita gamma d'aplicacions de dades |
Processament continu de dades empresarials | Tractament general de dades empresarials |
Petita segmentació de dades | Segmentació de big data |
Segmentació de dades allargada | Segmentació de dades de longitud fixa |
Contingut de dades percebut | Contingut de les dades desconegut |
Desduplicació de dades de temps | Desduplicació de dades espacials |
Desduplica els punts d'implementació
S'han de tenir en compte diversos factors a l'hora de desenvolupar o aplicar la tecnologia Dedupe, ja que aquests factors afecten directament el seu rendiment i eficàcia.
(1) | Què | Quines dades es desponderen? |
(2) | Quan | Quan s'eliminarà el pes? |
(3) | On | On és l'eliminació de pes? |
(4) | Com | Com reduir el pes? |
Tecnologia de desduplicació de claus
El procés de deduplicació del sistema d'emmagatzematge en general és el següent: en primer lloc, el fitxer de dades es divideix en un conjunt de dades, per a cada bloc de dades per calcular l'empremta digital, i després basant-se en les paraules clau de cerca de l'empremta digital Hash, la concordança indica les dades del duplicat. blocs de dades, només emmagatzema el número d'índex del bloc de dades, en cas contrari, vol dir que el bloc de dades és l'única peça d'un nou bloc d'emmagatzematge de dades i crea metainformació rellevant. Per tant, correspon un fitxer físic al sistema d'emmagatzematge. a una representació lògica d'un conjunt de metadades FP. En llegir el fitxer, primer llegiu el fitxer lògic, després, segons la seqüència FP, traieu el bloc de dades corresponent del sistema d'emmagatzematge, restaurau la còpia del fitxer físic. Pot Des del procés anterior es pot veure que les tecnologies clau de Dedupe inclouen principalment la segmentació de blocs de dades de fitxers, el càlcul d'empremtes digitals de blocs de dades i la recuperació de blocs de dades.
(1) Segmentació de blocs de dades de fitxers
(2) Càlcul de l'empremta digital del bloc de dades
(3) Recuperació de blocs de dades
Per trobar aquests models recomanats per iniciar la vostra deduplicació de paquets de xarxa:
Mylinking™ Network Packet Broker (NPB) ML-NPB-640048*10GE SFP+ més 4*40GE/100GE QSFP28, màxim 880 Gbps
Mylinking™ Network Packet Broker (NPB) ML-NPB-56606*40GE/100GE QSFP28 més 48*10GE/25GE SFP28, màxim 1,8 Tbps
Mylinking™ Network Packet Broker (NPB) ML-NPB-506048*10GE SFP+ més 2*40GE QSFP, màxim 560 Gbps
Mylinking™ Network Packet Broker (NPB) ML-NPB-486048*10GE SFP+, 480 Gbps màxim, Function Plus
Mylinking™ Network Packet Broker (NPB) ML-NPB-481048*10GE SFP+, màxim 480 Gbps
Mylinking™ Network Packet Broker (NPB) ML-NPB-2410P24*10GE SFP+, 240 Gbps màxim, funció DPI
Mylinking™ Network Packet Broker (NPB) ML-NPB-6400
48*10GE SFP+ més 4*40GE/100GE QSFP28, màxim 880 Gbps
Hora de publicació: 18-octubre-2022