Новые информационные технологии и программное обеспечение
  RSS    

20231229 200x300 0d249f2d3676e05c1a28a375dff09c2a



Сжатие данных - ключевая особенность твердотельных накопителей

Необходимость в сжатии хранимой информации заключается в том, что в результате больше данных может быть размещено на физическом носителе. Хранение большего объема данных на определенном количестве пространства диска снижает затраты на хранение и дает дополнительные преимущества в виде сокращения места, потребляемой энергии и требуемого охлаждения. 

Алгоритмы сжатия известны давно и применяются не первый десяток лет. Сложно представить себе накопитель без реализованной логики сжатия данных. И все же при всем многообразии можно выделить два основных способа сжатия данных - с потерями и без оных. Возможно, понятие "сжатие с потерями"  вызовет у кого-то искреннее недоумение, однако надо понимать разницу - пропажа даже одной цифры при сжатии таблицы годового отчета может повлечь многомиллионные штрафы. А вот нечеткость контуров темного фона с 30 по 31 минуту художественного фильма вряд-ли кто заметит. 

Требования к производительности сжатия данных изменяются и в зависимости от типа данных. Если данные должны быть часто доступны или должны быть доступны в режиме реального времени или близко к нему, процесс сжатия данных должен обладать исключительность производительностью. Требование к производительности падает, если данные менее важные или редко используемые.

Производительность имеет решающее значение при сжатии данных на основе твердотельных технологий. Твердотельные накопители, реализованные на технологии NAND Flash, используются в средах с повышенной производительностью. Время отклика является наиболее важным элементом в ускорении производительности. Иначе, потребитель выберет куда более эффективный по показателю цены за гигабайт обычный накопитель на жестких магнитных дисках, известный более как "винчестер".

Сжатие данных осуществляется с помощью дедупликации и компрессии. Дедупликация наиболее эффективна там, где есть повторяющиеся данные, например, резервные копии. Эффективность снижается, если данные становятся менее часто повторяющимися. Компрессия использует алгоритмический процесс для уменьшения представления данных в строках. Эффективность компресии варьируется в зависимости от типа данных или заданной степени сжатия.

Есть аргументы в пользу использования как дедупликации, так и компрессии, но многие из аргументов специфичны. Для первичных данных компрессия в системе хранения показала свою эффективность в течение длительного времени, начиная еще со времен виртуальных дисков StorageTek Iceberg/IBM RVA образца 1990-х годов.

Есть несколько способов уменьшить данные на NAND Flash. Один из методов основывается на использовании стандартных твердотельных устройств (SSD), заменивших жесткие диски (HDD) с приложением и передачей данных с помощью дисковых протоколов. Эти стандартные устройства имеют внутренний контроллер флэш-памяти и чипы флэш-памяти с протоколом интерфейса для имитации дисковода. В этом случае "добавляется" внешний по отношению к SSD контроллер системы хранения. Контроллер системы хранения реализован с помощью внутреннего процессора. В этом случае, "механизм" сжатия данных использует ресурсы контроллера и может иметь заметное влияние на производительность.

Замечено, что гораздо меньше шансов снизить производительность, если сжатие делается во время записи данных. Другой способ реализации - отложенное хранение данных, с последующим сжатием данных - заметно медленнее. 

Другие варианты с использованием флэш-памяти используют пользовательские флэш-контроллеры с флэш-памятью. Это уникальные конструкции для различных реализаций системы хранения. Часто в этих конструкциях используется shadow RAM для оптимизации обновления страницы. 

Сейчас эффективный и быстрый механизм сжатия данных является крайне важным конкурентным преимуществом для производителей SSD, ведь емкость твердотельных накопителей пока еще в разы отстает от жестких дисков, а так называемое "время жизни" подчас меньше, чем у винчестера, чья надежность зависит от механики, ненадежной "априори". Да, уже сейчас существуют серии накопителей для серверов, отличающиеся повышенной надежностью (от 20 тысяч циклов стирания/записи или по 10 перезаписей всего объема накопителя в день в течение 10 лет) и производительностью (до 600 Мб/сек и выше) но цена их несоизмерима высока (20-30-40 тысяч рублей) по сравнению с рядовыми твердотельными накопителями  (3 тысячи циклов стирания/записи), 5 тысяч рублей.

Конкурентная борьба, как видится, скоро должна привести к тому, что мы увидим к 2018 году 2-3 терабайтные твердотельные накопители по цене $100 за штуку. 

Оставьте свой комментарий!

Добавить комментарий


 

Самое читаемое:

Быстрый поиск

Инструкции к программам

Инструкции к программам

Сайт "Новые Информационные Технологии" содержит лишь справочные данные из открытых источников. Мы НЕ Рекламируем и НЕ Рекомендуем покупать или использовать ВСЕ упомянутые на сайте программы, оборудование и технологии