Устройства для хранения данных: Устройства хранение данных: виды, объем, технологии – Устройства хранения данных (накопители). Классификация устройств хранения данных, их основные характеристики. Интерфейсы подключения устройств хранения данных — computer-mouse.ru

Содержание

Устройство хранения данных — это… Что такое Устройство хранения данных?

Electrically Erasable Programmable Read-Only Memory, англ. flash memory), отличающиеся высокой скоростью доступа и возможностью быстрого стирания данных

По энергозависимости

Энергонезависимая память (англ. nonvolatile storage) — ЗУ, записи в которых не стираются при снятии электропитания. К этому типу памяти относятся все виды ПЗУ и ППЗУ.

Энергозависимая память (англ. volatile storage) — ЗУ, записи в которых стираются при снятии электропитания. К этому типу памяти относится ОЗУ, кэш-память.

(англ. dynamic storage) — разновидность энергозависимой полупроводниковой памяти, в которой хранимая информация с течением времени разрушается, поэтому для сохранения записей необходимо производить их периодическое восстановление (регенерацию), которое выполняется под управлением специальных внешних схемных элементов.

(англ. static storage) — разновидность энергозависимой полупроводниковой памяти, которой для хранения информации достаточно сохранения питающего напряжения, а регенерация не требуется.

По виду физического носителя и принципа рЕМА

Некоторые виды памяти могут носить сразу два и более «родовых» наименования по принципу работы.

Акустическая память (англ. acoustic storage) — в качестве среды для записи и хранения данных используются замкнутые акустические линии задержки.

Голографическая память (англ. holographic storage) — в качестве среды для записи и хранения используется пространственная графическая информация, отображаемая в виде интерференционных структур.

Емкостная память (англ. capacitor storage) — вид ЗУ, использующий в качестве среды для записи и хранения данных элементы электрической цепи — конденсаторы.

Криогенная память (англ. cryogenic storage) — в качестве среды для записи и хранения данных используются материалы, обладающие сверхпроводимостью.

Лазерная память (англ. laser storage) — вид памяти, в котором запись и считывание данных производятся лучом лазера (CD-R/RW, DVD+R/RW, DVD-RAM).

Магнитная память (англ. magnetic storage) — вид памяти, использующий в качестве среды для записи и хранения данных магнитный материал. Наиболее широко использующимися устройствами реализации магнитной памяти в современных ЭВМ являются накопители на магнитных лентах (НМЛ), магнитных (жестких и гибких) дисках (НЖМД и НГМД). Некоторые разновидности имеют собственные наименования:

Память на магнитной проволоке (англ. plated wire memory) — на ней строится автоматика авиационных «чёрных ящиков» благодаря высокой сохранности даже повреждённого носителя при аварийных ситуациях.
Память на магнитной пленке (англ. thin-film memory), наносимой на некоторую подложку, например стеклянную.
Ферритовая память (англ. core storage) — на ферритовых сердечниках, через которые пропущены тонкие медные проводники.
Память на цилиндрических магнитных доменах — использует генерацию и управляемое перемещение в неподвижном магнитном материале областей намагниченности (доменов). Имеет последовательный доступ, энергонезависима. Долгое время сохраняла лидерство в плотности хранения информации среди энергонезависимых устройств.

Магнитооптическая память (англ. magnetooptics storage) — вид памяти, использующий магнитный материал, запись данных на который возможна только при нагреве до температуры Кюри (порядка 1450 °C), осуществляемом в точке записи лучом лазера (объём записи на стандартные 3,5 и 5,25 дюймовые гибкие диски составляет при этом соответственно до 600 Мб и 1,3 Гб, существовали и MO диски меньшего объёма). В 2002 году компания Fujitsu выпустила магнитооптические накопители DynaMO 2300U2 и дискеты к ним (стандартный размер дискет — 3,5 дюйма) ёмкостью 2,3 Гбайт.

Сегнетоэлектрическая память англ. Ferroelectric RAM) — статическая оперативная память с произвольным доступом, ячейки которой сохраняют информацию, используя сегнетоэлектрический эффект («ferroelectric» переводится «сегнетоэлектрик, сегнетоэлектрический», а не «ферромагнетик», как можно подумать). Ячейка памяти представляет собой две токопроводящие обкладки, и плёнку из сегнетоэлектрического материала. В центре сегнетоэлектрического кристалла имеется подвижный атом. Приложение электрического поля заставляет его перемещаться. В случае, если поле «пытается» переместить атом в положение, например, соответствующее логическому нулю, а он в нём уже находится, через сегнетоэлектрический конденсатор проходит меньший заряд, чем в случае переключения ячейки. На измерении проходящего через ячейку заряда и основано считывание. При этом процессе ячейки перезаписываются, и информация теряется(требуется регенерация). Исследованиями в этом направлении занимаются фирмы Hitachi совместно с Ramtron, Matsushita с фирмой Symetrix. По сравнению с флеш-памятью, ячейки FRAM практически не деградируют — гарантируется до 10¹⁰ циклов перезаписи.

Молекулярная память (англ. molecular storage) — вид памяти, использующей технологию атомной тунельной микроскопии, в соответствии с которой запись и считывание данных производится на молекулярном уровне. Носителями информации являются специальные виды плёнок. Головки, считывающие данные, сканируют поверхность плёнки. Их чувствительность позволяет определять наличие или отсутствие в молекулах отдельных атомов, на чём и основан принцип записи-считывания данных. В середине 1999 года эта технология была продемонстрирована компанией Nanochip. В основе архитектуры устройств записи-считывания лежит технология MARE (Molecular Array Read-Write Engine). Достигнуты следующие показатели по плотности упаковки: ~40 Гбит/см² в устройствах чтения/записи и 128 Гбит/см² в устройствах с однократной записью, что считается в 6 раз выше, чем у экспериментальных образцов, которые основаны на классической технологии магнитной записи, и более чем в 25 раз превосходит лучшие её образцы, находящиеся в серийном производстве. Однако текущие (2008 год) достижения в скорости записи и считывания информации таким способом не позволяют говорить о массовом применении этой технологии.

Полупроводниковая память (англ. semiconductor storage) — вид памяти, использующий в качестве средств записи и хранения данных микроэлектронные интегральные схемы (БИС и СБИС). Преимущественное применение этот вид памяти получил в ПЗУ и ОЗУ ЭВМ, поскольку он характеризуется высоким быстродействием. Сравнительно недавно объём памяти, реализуемой на одной твердотельной (полупроводниковой) плате, ограничивался единицами Мбайт. Однако в настоящее время (2008 год) технологические достижения позволяют говорить о массовом использовании памяти в единицы и десятки гигабайт, а также о применении полупроводниковой памяти в качестве внешних носителей.

Исторически первыми были устройства, в которых состояние сохранялось в триггере — комбинации из двух и более транзисторов или, ранее, электронных ламп.
В дальнейшем большей плотности хранения при большем быстродействии достигли устройства емкостной памяти.

Фазоинверсная память (англ. Phase Change Rewritable storage, PCR) — разновидность лазерной (дисковой) памяти, использующей свойства некоторых полимерных материалов в точке лазерного нагрева в зависимости от температуры изменять фазовое состояние вещества (в частности кристаллизоваться или плавиться с возвращением в исходное состояние), а вместе с ним — и характеристики отражения. Указанная технология позволяет создавать оптические диски (650 Мб) для многократной перезаписи данных. Разработкой данной технологии занимается ряд компаний, включая Panasonic и Toshiba. Дальнейшее развитие этих принципов привело к развитию DVD, Blue-Ray технологий.

Электростатическая память (англ. electrostatic storage) — вид памяти, в котором носителями данных являются накопленные заряды статического электричества на поверхности диэлектрика.

По назначению, организации памяти и-или доступа

Автономное ЗУ (англ. off-line storage) — вид памяти, не допускающий прямого доступа к ней со стороны центрального процессора: обращение к ней, а также управление ею производится вводом в систему специальных команд и через посредство оперативной памяти.

Адресуемая память (англ. addressed memory) — вид памяти, к которой может непосредственно обращаться центральный процессор.

Ассоциативное ЗУ, АЗУ (англ. associative memory, content-addressable memory, CAM) — вид памяти, в котором адресация осуществляется на основе содержания данных, а не их местоположения, чем обеспечивается ускорение поиска необходимых записей. С указанной целью поиск в ассоциативной памяти производится на основе определения содержания в той или иной её области (ячейке памяти) слова, словосочетания, символа и т. п., являющихся поисковым признаком.

Существуют различные методы реализации АЗУ, в том числе использующие методы поиска основанные на «точном совпадении», «близком совпадении», «маскировании» слова-признака и т. д., а также различные процедуры реализации поиска, например, кэширования с целью производства «наилучшей оценки» истинного адреса, за которой следует проверка содержимого ячейки с вычисленным адресом. Некоторые ассоциативные ЗУ строятся по принципу последовательного, другие — параллельного сравнения признаков поиска (так называемые ортогональные ЗУ). Параллельные ассоциативные ЗУ нашли применение в организации кэш-памяти и виртуальной памяти. Ассоциативные ЗУ, потенциально, являются базой для построения высокоэффективных Лисп-процессоров и систем.

Буферное ЗУ (англ. buffer storage) — вид ЗУ, предназначенный для временного хранения данных при обмене ими между различными устройствами ЭВМ

Виртуальная память (англ. virtual memory):

Способ организации памяти, в соответствии с которым часть внешней памяти ЭВМ используется для расширения её «внутренней» (основной, оперативной) памяти. Например, содержимое некоторой области, не используемой в данный момент времени «внутренней» памяти, хранится на жёстком диске и возвращается в оперативную память по мере необходимости.
Область (пространство) памяти, предоставляемая отдельному пользователю или группе пользователей и состоящая из основной и внешней памяти ЭВМ, между которыми организован так называемый постраничный обмен данными. С указанной целью всё адресное пространство делится на страницы памяти. Поиск адресов страниц производится в ассоциативной памяти.

Временная память (англ. temporary storage) — специальное запоминающее устройство или часть оперативной памяти или внешней памяти, резервируемые для хранения промежуточных результатов обработки.

Вспомогательная память (англ. auxiliary storage) — часть памяти ЭВМ, охватывающая внешнюю и наращенную оперативную память.

Вторичная память (англ. secondary storage) — вид памяти, который в отличие от основной памяти имеет большее время доступа, основывается на блочном обмене, характеризуется большим объёмом и служит для разгрузки основной памяти.

Гибкая память (англ. elastic storage) — вид памяти, позволяющей хранить переменное число данных, пересылать (выдавать) их в той же последовательности, в которой принимает, и варьировать скорость вывода.

Дополнительная память (англ. add-in memory) — вид устройства памяти, предназначенного для увеличения объёма основной оперативной или внешней памяти на жёстком магнитном диске (ЖМД), входящих в основной комплект поставки ЭВМ.

Иерархическая память (англ. hierarchical storage) — вид памяти, имеющей иерархическую структуру, на верхнем уровне которой используется сверхоперативное запоминающее устройство, а на нижнем уровне — архивное ЗУ сверхбольшой ёмкости.

Кеш-память (англ. cache memory) — часть архитектуры устройства или программного обеспечения, осуществляющая хранение часто используемых данных для предоставления их в более быстрый доступ, нежели кешируемая память.

Коллективная память, память коллективного доступа (англ. shared memory):

Память, доступная множеству пользователей, которые могут обращаться к ней одновременно или последовательно.
Память, связанная одновременно с несколькими процессорами для обеспечения их взаимодействия при совместно решаемых ими задачах и использовании общих для них программных средств.

Корректирующая память (англ. patch memory) — часть памяти ЭВМ, предназначенная для хранения адресов неисправных ячеек основной памяти. Также используются термины «relocation table» и «remap table».

Локальная память (англ. local memory) — «внутренняя» память отдельного устройства ЭВМ (процессора, канала и т. п.), предназначенная для хранения управляющих этим устройством команд, а также сведений о состоянии устройства.

Магазинная (стековая) память (англ. pushdown storage) — вид памяти, являющийся аппаратной реализацией магазинного списка — стека, запись и считывание в котором осуществляются через одну и ту же ячейку — вершину стека. Это память абстрактного типа.

Матричная память (англ. matrix storage) — вид памяти, элементы (ячейки) которой имеют такое расположение, что доступ к ним осуществляется по двум или более координатам.

Многоблочная память (англ. multibunk memory) — вид оперативной памяти, организованной из нескольких независимых блоков, допускающих одновременное обращение к ним, что повышает её пропускную способность. Часто употребляется термин «интерлив» (калька с англ. interleave — перемежать) и может встречаться в документации некоторых фирм «многоканальная память» (англ. Multichanel).

Многовходовая память (англ. multiport storage memory) — устройство памяти, допускающее независимое обращение с нескольких направлений (входов), причём обслуживание запросов производится в порядке их приоритета.

Многоуровневая память (англ. multilevel memory) — организация памяти, состоящая из нескольких уровней запоминающих устройств с различными характеристиками и рассматриваемая со стороны пользователей как единое целое. Для многоуровневой памяти характерна страничная организация, обеспечивающая «прозрачность» обмена данными между ЗУ разных уровней.

Непосредственно управляемая (оперативно доступная) память (англ. on-line storage) — память, непосредственно доступная в данный момент времени центральному процессору.

Объектно-ориентированная память (англ. object storage) — память, система управления которой ориентирована на хранение объектов. При этом каждый объект характеризуется типом и размером записи.

Оверлейная память (англ. overlayable storage) — вид памяти с перекрытием вызываемых в разное время программных модулей.

Память параллельного действия (англ. parallel storage) — вид памяти, в которой все области поиска могут быть доступны одновременно.

Перезагружаемая управляющая память (англ. reloadable control storage) — вид памяти, предназначенный для хранения микропрограмм управления и допускающий многократную смену содержимого — автоматически или под управлением оператора ЭВМ.

Перемещаемая память (англ. data-carrier storage) — вид архивной памяти, в которой данные хранятся на перемещаемом носителе. Непосредственный доступ к ним от ЭВМ отсутствует.

Память последовательного действия (англ. sequential storage) — вид памяти, в которой данные записываются и выбираются последовательно — разряд за разрядом.

Память процессора, процессорная память (англ. processor storage) — память, являющаяся частью процессора и предназначенная для хранения данных, непосредственно участвующих в выполнении операций, реализуемых арифметико-логическим устройством и устройством управления.

Память со встроенной логикой, функциональная память (англ. logic-in-memory) — вид памяти, содержащий встроенные средства логической обработки (преобразования) данных, например их масштабирования, преобразования кодов, наложения полей и др.

Рабочая (промежуточная) память (англ. working (intermediate) storage):

Часть памяти ЭВМ, предназначенная для размещения временных наборов данных.
Память для временного хранения данных.

Реальная память (англ. real storage) — вся физическая память ЭВМ, включая основную и внешнюю память, доступная для центрального процессора и предназначенная для размещения программ и данных.

Регистровая память (англ. register storage) — вид памяти, состоящей из регистров общего назначения и регистров с плавающей запятой. Как правило, содержится целиком внутри процессора.

Свободная (доступная) память (англ. free space) — область или пространство памяти ЗУ, которая в данный момент может быть выделена для загрузки программы или записи данных.

Семантическая память (англ. semantic storage) — вид памяти, в которой данные размещаются и списываются в соответствии с некоторой структурой понятийных признаков.

Совместно используемая (разделяемая) память (англ. shareable storage) — вид памяти, допускающий одновременное использование его несколькими процессорами.

Память с защитой, защищённое ЗУ (англ. protected storage) — вид памяти, имеющий встроенные средства защиты от несанкционированного доступа к любой из его ячеек.

Память с последовательным доступом (англ. sequential access storage) — вид памяти, в которой последовательность обращённых к ним входных сообщений и выборок данных соответствует последовательности, в которой организованы их записи. Основной метод поиска данных в этом виде памяти — последовательный перебор записей.

Память с прямым доступом, ЗУ с произвольной выборкой (ЗУПВ) (англ. Random Access Memory, RAM) — вид памяти, в котором последовательность обращённых к ним входных сообщений и выборок данных не зависит от последовательности, в которой организованы их записи или их местоположения.

Память с пословной организацией (англ. word-organized memory) — вид памяти, в которой адресация, запись и выборка данных производится не побайтно, а пословно.

Статическая память (англ. static storage) — вид памяти, в котором положение данных и их значение не изменяются в процессе хранения и считывания. Разновидностью этого вида памяти является статическое ЗУПВ [static RAM].

Страничная память (англ. page memory) — память, разбитая на одинаковые области — страницы. Обмен с такой памятью осуществляется страницами.

Управляющая память (англ. control storage) — память, содержащая управляющие программы или микропрограммы. Обычно реализуется в виде ПЗУ.

Различные типы памяти обладают разными преимуществами, из-за чего в большинстве современных компьютеров используются сразу несколько типов устройств хранения данных.

Первичная и вторичная память

Первичная память характеризуется наибольшей скоростью доступа. Центральный процессор имеет прямой доступ к устройствам первичной памяти; иногда они даже размещаются на одном и том же кристалле.

В традиционной интерпретации первичная память содержит активно используемые данные (например, программы, работающие в настоящее время, а также данные, обрабатываемые в настоящее время). Обычно бывает высокоскоростная, относительно небольшая, энергозависимая (не всегда). Иногда её называют основной памятью.

Вторичная память также называется периферийной. В ней обычно хранится информация, не используемая в настоящее время. Доступ к такой памяти происходит медленнее, однако объёмы такой памяти могут быть в сотни и тысячи раз больше. В большинстве случаев энергонезависима.

Однако это разделение не всегда выполняется. В качестве основной памяти может использоваться диск с произвольным доступом, являющийся вторичным запоминающим устройством (ЗУ). А вторичной памятью иногда называются отключаемые или извлекаемые ЗУ, например, ленточные накопители.

Во многих КПК оперативная память и пространство размещения программ и данных находится физически в одной памяти, в общем адресном пространстве.

Произвольный и последовательный доступ

ЗУ с произвольным доступом отличаются возможностью передать любые данные в любом порядке. Оперативное запоминающее устройство, ОЗУ и винчестер — примеры такой памяти.

ЗУ с последовательным доступом, напротив, могут передавать данные только в определённой последовательности. Ленточная память и некоторые типы флеш-памяти имеют такой тип доступа.

Блочный и файловый доступ

На винчестере, используются 2 типа доступа. Блочный доступ предполагает, что вся память разделена на блоки одинаковых размеров с произвольным доступом. Файловый доступ использует абстракции — папки с файлами, в которых и хранятся данные. Другой способ адресации — ассоциативная использует алгоритм хеширования для определения адреса.

Типы запоминающих устройств

Полупроводниковая:
См. также
Литература
- Память // Словарь компьютерных терминов = Dictionary of Personal Computing / Айен Синклер; Пер. с англ. А. Помогайбо — М.: Вече, АСТ, 1996. — С. 177, ISBN 5-7141-0309-2.
Ссылки

Устройства хранения информации

Запоминающее устройство — носитель информации, предназначенный для записи и хранения данных. В основе работы запоминающего устройства может лежать любой физический эффект, обеспечивающий приведение системы к двум или более устойчивым состояниям.

Устройства хранения информации делятся на 2 вида:

К внешним устройствам относятся магнитные диски, CD,DVD,BD,cтримеры,жесткий диск(винчестер),а также флэш-карта. Внешняя память дешевле внутренней, создаваемой обычно на основе полупроводников. Кроме того, большинство устройств внешней памяти может переноситься с одного компьютера на другой. Главный их недостаток в том, что они работают медленнее устройств внутренней памяти.

К внутренним устройствам относятся оперативная память, кэш-память, CMOS-память, BIOS. Главным достоинством является скорость обработки информации. Но в то же время устройства внутренней памяти довольно дорогостоящи.

НГМД (накопитель на гибких магнитных дисках)

Использование гибких дисков уходит в прошлое. Бывают двух типов и обеспечивают хранение информации на дискетах одного из двух форматов: 5,25′ или 3,5′. Дискеты формата 5,25′ в настоящее время практически не встречаются (максимальная емкость 1,2 Мб). Для дискет формата 3,5′ максимальная емкость составляет 2,88 Мб, самый распространенный формат емкости для них – 1,44 Мб. Гибкие магнитные диски помещаются в пластмассовый корпус. В центре дискеты имеется приспособление для захвата и обеспечения вращения диска внутри пластмассового корпуса. Дискета вставляется в дисковод, который вращается с постоянной угловой скоростью. Все дискеты перед употреблением форматируются – на них наносится служебная информация, обе поверхности дискеты разбиваются на концентрические окружности – дорожки, которые в свою очередь делятся на сектора. Одноименные сектора обеих поверхностей образуют кластеры. Магнитные головки примыкают к обеим поверхностям и при вращении диска проходят мимо всех кластеров дорожки. Перемещение головок по радиусу с помощью шагового двигателя обеспечивает доступ к каждой дорожке. Запись/чтение осуществляется целым числом кластеров, обычно под управлением операционной системы. Однако в особых случаях можно организовать запись/чтение и в обход операционной системы, используя напрямую функции BIOS. В целях сохранения информации гибкие магнитные диски необходимо предохранять от воздействия сильных магнитных полей и нагревания, так как такие воздействия могут привести к размагничиванию носителя и потере информации.

НЖМД (накопитель на жестких магнитных дисках)

Накопитель на жестком диске относится к наиболее совершенным и сложным устройствам современного ПК. Его диски способны вместить многие мегабайты информации, передаваемой с огромной скоростью.Основные принципы работы жесткого диска мало изменились со дня его создания.Взглянув на накопитель на жестком диске, вы увидите только прочный металлический корпус. Он полностью герметичен и защищает дисковод от частичек пыли. Кроме того, корпус экранирует накопитель от электромагнитных помех.

Диск представляет собой круглую пластину с очень ровной поверхностью чаще из алюминия, реже — из

керамики или стекла, покрытую тонким ферромагнитным слоем. Магнитные головки считывают и записывают информацию на диски. Цифровая информация преобразуется в переменный электрический ток, поступающий на магнитную головку, а затем передается на магнитный диск, но уже в виде магнитного поля, которое диск может воспринять и «запомнить». Под воздействием внешнего магнитного поля собственные магнитные поля доменов ориентируются в соответствии с его направлением. После прекращения действия внешнего поля на поверхности диска образуются зоны остаточной намагниченности. Таким образом сохраняется записанная на диск информация. Участки остаточной намагниченности, оказавшись при вращении диска напротив зазора магнитной головки, наводят в ней электродвижущую силу, изменяющуюся в зависимости от величины намагниченности. Пакет дисков, смонтированный на оси-шпинделе, приводится в движение специальным двигателем, компактно расположенным под ним. Скорость вращения дисков, как правило, составляет 7200 об./мин. Для того, чтобы сократить время выхода накопителя в рабочее состояние, двигатель при включении некоторое время работает в форсированном режиме. Поэтому источник питания компьютера должен иметь запас по пиковой мощности. Появление в 1999 г. изобретенных фирмой IBM головок с магниторезистивным эффектом (GMR – Giant Magnetic Resistance) привело к повышению плотности записи до 6,4 Гбайт на одну пластину в уже представленных на рынке изделиях.

Основные параметры жесткого диска:

Емкость – винчестер имеет объем от 40 Гб до 200 Гб.
Скорость чтения данных. Средний сегодняшний показатель – около 8 Мбайт/с.
Среднее время доступа. Измеряется в миллисекундах и обозначает то время, которое необходимо диску для доступа к любому выбранному вами участку. Средний показатель – 9 мс.
Скорость вращения диска. Показатель, напрямую связанный со скоростью доступа и скоростью чтения данных. Скорость вращения жесткого диска в основном влияет на сокращение среднего времени доступа (поиска). Повышение общей производительности особенно заметно при выборке большого числа файлов.
Размер кэш-памяти – быстрой буферной памяти небольшого объема, в которую компьютер помещает наиболее часто используемые данные. У винчестера есть своя кэш-память размером до 8 Мбайт.
Фирма-производитель. Освоить современные технологии могут только крупнейшие производители, потому что организация изготовления сложнейших головок, пластин, контроллеров требует крупных финансовых и интеллектуальных затрат. В настоящее время жесткие диски производят семь компаний: Fujitsu, IBM-Hitachi, Maxtor, Samsung, Seagate, Toshiba и Western Digital. При этом каждая модель одного производителя имеет свои, только ей присущие особенности.

Стримеры

лассическим способом резервного копирования является применение стримеров – устройств

записи на магнитную ленту. Однако возможности этой технологии, как по емкости, так и по скорости, сильно ограничены физическими свойствами носителя. Стример по принципу действия очень похож на кассетный магнитофон. Данные записываются на магнитную ленту, протягиваемую мимо головок. Недостатком стримера является слишком большое время последовательного доступа к данным при чтении. Емкость стримера достигает нескольких Гбайт, что меньше емкости современных винчестеров, а время доступа во много раз больше.

Flash-карта

Устройства, выполненные на одной микросхеме (кристалле) и не имеющие подвижных частей, основаны на кристаллах электрически перепрограммируемой флэш-памяти. Физический принцип организации ячеек флэш-памяти можно считать одинаковым для всех выпускаемых устройств, как бы они ни назывались. Различаются такие устройства по интерфейсу и применяемому контроллеру, что обусловливает разницу в емкости, скорости передачи данных и энергопотреблении.

Multimedia Card (MMC) и Secure Digital (SD) – сходит со сцены из-за ограниченной емкости (64 Мб и 256 Мб соответственно) и низкой скорости работы.

SmartMedia – основной формат для карт широкого применения (от банковских и проездных в метро до удостоверений личности). Тонкие пластинки весом 2 грамма имеют открыто расположенные контакты, но значительная для таких габаритов емкость (до 128 Мбайт) и скорость передачи данных (до 600 Кбайт/с) обусловили их проникновение в сферу цифровой фотографии и носимых МРЗ-устройств.

Memory Stick – “эксклюзивный” формат фирмы Sony, практически не используется другими компаниями. Максимальная емкость – 256 Мбайт, скорость передачи данных доходит до 410 Кбайт/с, цены сравнительно высокие.

CompactFlash (CF) – самый распространенный, универсальный и перспективный формат. Легко подключается к любому ноутбуку. Основная область применения – цифровая фотография. По емкости (до 3 Гбайт) сегодняшние CF-карты не уступают IBM Microdrive, однако отстают по скорости обмена данными (около 2 Мбайт/с).

USB Flash Drive – последовательный интерфейс USB с пропускной способностью 12 Мбит/с или его современный вариант USB 2.0 с пропускной способностью до 480 Мбит/с. Сам носитель заключен в обтекаемый компактный корпус, напоминающий автомобильный брелок. Основные параметры (емкость и скорость работы) полностью совпадают с CompactFlash, поскольку чипы самой памяти остались прежними. Может служить не только “переносчиком” файлов, но и работать как обычный накопитель – с него можно запускать приложения, воспроизводить музыку и сжатое видео, редактировать и создавать файлы. Низкое среднее время доступа к данным на Flash-диске – менее 2,5 мс. Вероятно, накопители класса USB Flash Drive, особенно с интерфейсом USB 2.0, в перспективе смогут полностью заменить собой обычные дискеты и частично – перезаписываемые компакт-диски, носители Iomega ZIP и им подобные.

PC Card (PCMCIA ATA) – основной тип флэш-памяти для компактных компьютеров. В настоящее время существует четыре формата карточек PC Card: Type I, Type II, Type III и CardBus, различающиеся размерами, разъемами и рабочим напряжением. Для PC Card возможна обратная совместимость по разъемам “сверху вниз”. Емкость PC Card достигает 4 Гб, скорость – 20 Мб/с при обмене данными с жестким диском.

Лекция 8 Устройства хранения данных

Лекция 8. Устройства хранения данных

Вопросы:

Общая характеристика устройств хранения данных.
Принципы хранения информации.
Хранение информации на магнитных дисках.

Литература: 1. Гук. М. Аппаратные средства IBM PC. Питер, 2005, с. 510-545.

Общая характеристика устройств хранения данных.

Утройства хранения данных относятся к внешней памяти компьютера — они пзволяют сохранять информацию для последующего ее использования независимо от состояния (включен или выключен) компьютера. В устройствах хранения данных могут быть реализованы различные физические принципы хранения информации — магнитный, оптический, электронный в любых их сочетаниях. Внешняя память принципиально отличается от внутренней (оперативной) способом доступа к этой памяти процессора (исполняемой программы). Устройства внешней памяти оперируют блоками информации, но никак не байтами или словами, как, например, оперативная память. Эти блоки обычно имеют фиксированный размер, кратный степени числа 2. Блок может быть переписан из внутренней памяти во внешнюю или обратно только целиком, и для выполнения любой операции обмена с внешней памятью требуется специальная процедура (подпрограмма). Процедуры обмена с устройствами внешней памяти привязаны к типу устройства, его контроллеру и способу подключения устройства к системе (интерфейсу).

По методу доступа к информации устройства внешней памяти разделяются на устройства с прямым (или непосредственным) и последовательным доступом.

Прямой доступ подразумевает возможность обращения к блокам по их адресам в произвольном порядке. Традиционными устройствами с прямым доступом являются дисковые накопители, и часто в понятие «диск», или «дисковое устройство» вкладывают значение «устройство внешней памяти прямого доступа». Так, например, виртуальный диск в ОЗУ и электронный диск на флэш-памяти отнюдь не имеют круглых, а тем более вращающихся деталей.

Традиционными устройствами с последовательным доступом являются накопители на магнитной ленте, они же стримеры. Здесь каждый блок информации тоже может иметь свой адрес, но для обращения к нему устройство хранения должно сначала найти некоторый маркер начала ленты (тома), после чего последовательным холостым чтением блока за блоком дойти до требуемого места и только тогда производить собственно операции обмена данными. Конечно, каждый раз возвращаться на начало ленты необязательно, однако необходимость последовательного сканирования блоков (вперед или назад) — неотъемлемое свойство устройств последовательного доступа. Несмотря на очевидный проигрыш во времени доступа к требуемым данным, ленточные устройства последовательного доступа в качестве внешней памяти находят применение для хранения очень больших массивов информации. В отличие от них устройства прямого доступа — диски самой различной природы — являются обязательной принадлежностью подавляющего большинства компьютеров.

Главная характеристика устройств — емкость хранения, измеряемая в килобайтах, мегабайтах, гигабайтах и терабайтах (Кбайт, Мбайт, Гбайт, Тбайт, или в английской транскрипции КВ, МВ, СВ, ТВ, или, еще короче — К, М, С, Т). Здесь, как правило, приставки кило-, мега-, гига-, тера- имеют десятичные значения — 10³, 10⁶, 10⁹ и 10¹² соответственно. В других подсистемах компьютера, наример при определении объема ОЗУ, ПЗУ и другой внутренней памяти, эти же приставки чаще применяют в двоичных значениях 2’°, 2²⁰, 2³⁰ и 2⁴⁰ соответственно, при этом 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт, 1 Тбайт = 1024 Гбайт. Этими разночтениями объясняются различия значений емкости одного и того же устройства, полученных из разных источников. «Двоичные» кило-, мега-, гига-, тера- более «увесисты», поэтому емкость устройства, выраженная в десятичных единицах, будет выглядеть внушительнее. Так, например, объем памяти в 528 Мбайт (десятичных) составляет 504 Мбайт (двоичных).

Устройства внешней памяти могут иметь сменные или фиксированные носители информации. Применение сменных носителей позволяет хранить неограниченный объем информации, а если носитель и формат записи стандартизованы, то они позволяют еще и обмениваться информацией между компьютерами. Существуют устройства с автоматической сменой носителя — ленточные карусели, дисковые устройства JuкеВох. Эти достаточно дорогие устройства применяют в мощных файл-серверах. Для настольных машин имеются накопители СD-RОМ с несколькими дисками (СD-сhаngеr), сменяемыми автоматически.

Важнейшими общими параметрами устройств являются время доступа, скорость передачи данных и удельная стоимость хранения информации.

Время доступа (ассеs time) определяется как усредненный интервал от выдачи запроса на передачу блока данных до фактического начала передачи. Дисковые устройства имеют время доступа от единиц до сотен миллисекунд. Для электронных устройств внешней памяти время доступа определяется быстродействием используемых микросхем памяти и при чтении составляет доли микросекунд, причем запись может продолжаться значительно дольше, что объясняется природой энергонезависимой электронной памяти. Для устройств с подвижными носителями основной расход времени имеет место в процессе позиционирования головок (seek time — время поиска) и ожидания подхода к ним требуемого источника носителей (latency — скрытый период). Для дисковых и ленточных устройств принципы позиционирования различны, и различные составляющие процесса поиска.

Скорость записи и считывания определяется как отношение объема записываемых или считываемых данных ко времени, затрачиваемому на эту операцию. В затраты времени входит и время доступа, и время передачи данных. При этом оговаривается характер запросов — линейный или случайный, что сильно сказывается на величине скорости из-за влияния времени доступа. При определении скорости линейных запросов чтения-записи производится обращение к длинной цепочке блоков с последовательным нарастанием адреса. При определении скорости случайных запросов чтения-записи — соседние запросы разбросаны по всему носителю. Для современных многозадачных ОС характерно чередующееся выполнение нескольких потоков запросов, и в каждом потоке высока вероятность последовательного нарастания адреса.

Скорость передачи данных определяется как производительность обмена данными, измеряемая после выполнения поиска данных. Однако в способе измерения этого параметра возможны разночтения, поскольку современные устройства имеют в своем составе буферную память существенных размеров. Скорости обмена буферной памяти с собственно носителем (внутренняя скорость) и с внешним интерфейсом могут существенно различаться. Если скорость работы внешнего интерфейса ограничивается быстродействием электронных схем и достижимой частотой передаваемых сигналов, то внутренняя скорость более жестко ограничивается возможности электромеханических устройств, (скоростью движения носителя и плотностью записи). При измерениях скорости передачи на небольших объемах пересылок проявится ограничение внешнего интерфейса буферной памяти, при средних объемах — ограничение внутренней скорости, а при больших объемах проявится еще и время поиска последующих блоков информации. Бывает, что в качестве скорости передачи данных указывают лишь максимальную скорость интерфейса, а о внутренней скорости можно судить по частоте вращения дисковых носителей и числу секторов на треке.

Определение удельной стоимости хранения информации для накопителей с фиксированными носителями пояснения не требует. В случае сменных носителей этот показатель интересен для собственно носителей, но не следует забывать и о цене самих приводов, которую тоже можно приводить к их емкости.

По отношению к корпусу компьютера устройства могут быть внутренними и внешними.

Внутренние устройства помещаются в специальные трех- или пятидюймовые отсеки корпуса компьютера и питаются от его же блока питания. В описании корпусов компьютеров отсеки также подразделяются на внешние и внутренние, но они различаются лишь тем, может ли передняя панель устройства, установленного в отсек, выходить на лицевую панель корпуса или нет.

Внешние устройства помещают в отдельный корпус, а питаются они от собственного блока питания или перехватывают питание +5 В от разъема клавиатуры компьютера. Внешнее исполнение имеют как малогабаритные портативные устройства, так и особо крупные дисковые массивы. Сами приводы для внешних и внутренних устройств обычно имеют одинаковый конструктив одного из распространенных форматов.

Принципы хранения информации.

Энергонезависимое хранение информации может осуществляться на различных физических принципах. Раньше всех начали применять магнитный способ хранения, где запись нуля или единицы изменяет направление намагниченности элементарной хранящей ячейки. Устройства хранения на магнитных сердечниках состояли из матрицы ферритовых колец (по кольцу на каждый хранящийся бит), пронизанных обмотками (адреса, записи и считывания).

Шины адрес ячейки

Шины считывания информации

Рис. 8.1. Матрица ферритовых колец памяти.

Считывание выполнялось импульсом тока, пытающимся намагнитить ячейку в определенном направлении. Если ячейка была в противоположном состоянии, то эта попытки наводила импульс в обмотке считывания. Устройства ферритовой памяти были громоздкими, но сугубо статическими — в них не было движущихся частей. В устройствах с подвижным носителем хранящие ячейки движутся относительно головок записи-считывания и в зависимости от направления намагниченности вызывают в головке считывания импульс определенной полярности. На таком принципе строились и магнитные барабаны первых ЭВМ, и магнитные диски, и накопители на магнитной ленте.

Оптические устройства хранения основаны на изменении отражающей или пропускающей способности участков носителей. Носителями для первых оптических устройств были фотопленка, перфолента, перфокарты. Теперь оптические устройства хранят информацию на дисках с ячейками микроскопических размеров, считываемых лазерным лучом. В конце 2000 года появилось сообщение о новом типе оптических дисков FMD (Fluorescent Multilayer Disk = флуоресцентный многослойный диск), разработанном компанией Constetlation 3D Inc. (СЗD). В этих дисках информацию несут частички флуоресцирующего вещества, вкрапленные в слои прозрачного пластика. В отличие от СD/DVD, где информативна степень отражениz лазерного луча от текущей точки поверхности, здесь воспринимается флуоресцентное свечение, вызванное этим лучом. Оптическая система привода позволяет фокусироваться лишь на требуемом слое. Поскольку слои прозрачны, их число может быть значительно увеличено без ощутимых потерь сигнала. Для начала предлагается 12-слойный диск емкостью 50 Гбайт со скоростью считывания до 1 Гбит/с. Пока что разработана технология печати дисков с матриц (RОМ), но уже прорабатывается и технология однократно записываемых дисков. Первые сообщения о проекте «трехмерных дисков» появились еще в 1997 году.

Из электронных устройств распространение получила флэш-память, сочетающая довольно высокую плотность хранения с теперь уже приемлемой ценой. Флэш-память является статической и имеет очень высокое быстродействие считывания, но не очень быструю процедуру записи, причем для перезаписи должен предварительно стираться целый блок ячеек (современные микросхемы состоят из набора блоков). В режиме хранения на флэш-память питание можно не подавать — энергопотребление нулевое. В режиме чтения потребление достаточно малое, но стирание и запись требуют энергозатрат.

Устройства хранения на флэш-памяти выпускаются в разнообразных конструктивных исполнениях. Первые «статические диски» выполнялись в виде устройств формата 3,5″ с интерфейсом АТА. Затем появились флэш-карты с интерфейсом РС Card (РСМСIА), Card Bus, которые используются в блокнотных ПК, а также в ряде бытовых электронных устройств, например в цифровых фотокамерах. Поскольку процессы записи-считывания такого «диска» не связаны с механическими перемещениями, его производительность (особенно по чтению) на несколько порядков превышает производительность самых лучших жестких дисков. Флэш-память относится к классу электрического стирания, но использует особую технологию построения запоминающих ячеек. Стирание производится сразу для целой области ячеек или полностью для всей микросхемы.

Каждая ячейка флэш-памяти состоит всего из одного униполярного (полевого) транзистора. Чистые (стертые) ячейки содержат единицу во всех битах; при записи (программировании) нужные ячейки обнуляются. Возможно последующее программирование и уже записанных ячеек, но при этом можно обнулять единичные биты , а не наоборот. В единичное состояние ячейки переводятся только при стирании. Стирание производится для всей матрицы ячеек; стирание одиночной ячейки невозможно.

Хранение информации на магнитных дисках.

Дисковые накопители имеют своей основой механизм, схематически представленный на рис. 8.2.

Вращение диска

Головка записи-считывания

Поиск трека

Рис. 8.2. Устройство дискового накопителя

Носителем информации является диск (один или несколько), на который нанесен слой вещества, способного намагничиваться (чаще всего ферромагнитный). Хранимую информацию представляет состояние намагниченности отдельных участков рабочей поверхности. Диски вращаются с помощью двигателя шпинделя, обеспечивающего требуемую частоту вращения в рабочем режиме. На диске имеется индексный маркер, который, проходя мимо специального датчика, отмечает начало каждого оборота диска. Информация на диске располагается на концентрических треках (дорожках), нумерация которых начинается с внешнего трека (трек 00). Каждый трек разбит на секторы фиксированного размера. Сектор и является минимальным блоком информации, который может быть записан на диск или считан с него. Нумерация секторов начинается с единицы и привязывается к индексному маркеру. Каждый сектор имеет служебную область, содержащую адресную информацию, контрольные коды и некоторую другую информацию, и область данных, размер которой традиционно составляет 512 байт. Если накопитель имеет несколько рабочих поверхностей (на шпинделе может быть размещен пакет дисков, а у каждого диска могут использоваться обе поверхности), то совокупность всех треков с одинаковыми номерами составляет цилиндр. Для каждой рабочей поверхности в накопителе имеется своя головка, обеспечивающая запись и считывание информации. Головки нумеруются, начиная с нуля. Для того чтобы произвести элементарную операцию обмена — запись или чтение сектора, шпиндель должен вращаться с заданной скоростью, блок головок должен быть подведен к требуемому цилиндру, и только когда нужный сектор подойдет к выбранной головке, начнется физическая операция обмена данными между головкой и блоком электроники накопителя. Кроме того, головки считывают служебную информацию (адресную и сервисную), позволяющую определить и установить их текущее местоположение. Для записи информации на носитель используюся различные методы частотной модуляции, позволяющие кодировать двоичную информацию, намагничивая зоны магнитного слоя, проходящие под головкой. Перемагничивание зоны происходит лишь в том случае, если магнитное поле в ней преодолеет некоторый порог Н_с (коэрцитивную силу), свойственный данному носителю,

Намагничивание

Размагничивание

+в_r

-Н₂-н_с +н_с

Н₁ н

-в_r

где

При считывании намагниченные зоны наводят в головке электрический сигнал, величина напряжения которого равна:

где — скорость вращения диска намагниченного величиной;

w – число обмоток в считывающей головке;

S – поперечное сечение магнитного материала (зона записи), из которого декодируется ранее записанная информация.

Контроллер накопителя выполняет сборку и разборку блоков информации (секторов или целых треков), включая формирование и проверку контрольных кодов, осуществляет модуляцию и демодуляцию сигналов головок и управляет всеми механизмами накопителя.

Несмотря на кажущуюся простоту конструкции записать и потом достоверно считать информацию с диска не так-то просто. Для записи данных необходимо сформировать последовательный код, который должен быть самосинхронизирующимся:

при последующем считывании из него должны извлекаться и данные, и синхросигнал, что позволяет восстановить записанную цепочку битов (этим занимается сепаратор данных — узел дискового контроллера).

Кроме того, напомним, что индуктивные считывающие головки воспринимают только факты изменения намагниченности участков трека. Также учтем, что физическое исполнение — магнитные свойства носителя, конструкция головок, скорость движения, высота расположения головок и т. п. — задает предельно достижимую плотность изменения состояния намагниченности, которую хотелось бы использовать максимально эффективно. Эта плотность измеряется в количестве зон с различным состоянием намагниченности на дюйм длины трека и в современных накопителях достигает десятков тысяч BPI (Bit Per Inch = бит на дюйм). Для записи на диск применяют различные схемы кодирования, отличающиеся по сложности реализации и эффективности работы. В первых моделях накопителей использовалась частотная модуляция FM. Здесь для каждого бита данных на треке отводится ячейка с окнами для представления бита и синхросигнала, что весьма неэффективно расходует предел плотности намагниченности. Более эффективна модифицированная частотная модуляция MFM, при которой синхросигнал вводится только в процессе кодирования следующих подряд нулевых битов, что позволяет удвоить плотность записи при той же плотности изменения потока. Обе схемы (FM и MFM) являются схемами с побитным кодированием. Более эффективны схемы группового кодирования, при которых цепочка байтов данных (сектор) предварительно разбивается на группы по несколько битов, кодирующихся по определенным правилам. Схема кодирования RLL (Run Length Limited), как это следует из названия (работа в ограниченной длине), построена на ограничении длины неперемагничиваемых участков трека. Наиболее популярна схема RLL 2.7 — в ней число неперемагничиваемых ячеек лежит в диапазоне от 2 до 7. Для накопителей с высокой плотностью используется схема RLL 1.7, обеспечивающая большую надежность считывания.

Из-за того что линейная скорость носителя относительно головки на внутренних цилиндрах меньше, чем на внешних, для обеспечения нормальной записи при меньшей скорости приходится применять предварительную компенсацию записи. Для накопителей со встроенным контроллером этот параметр игнорируется, поскольку они сами «знают», как работать со своими дисками.

Информация на дисках записывается и считывается по-секторно, и каждый сектор имеет определенную структуру (формат). В заголовке имеется поле идентификатора, включающее номер цилиндра, головки и собственно сектора. В этом же идентификаторе может содержаться и пометка о дефектности сектора, служащая указанием на невозможность его использования для хранения данных. Достоверность поля идентификатора проверяется с помощью контрольного кода заголовка. Заголовки секторов записываются только во время операции низкоуровневого форматирования, причем для всего трека сразу. При обращении к сектору по чтению или записи заголовок только считывается. Поле данных сектора отделено от заголовка небольшим зазором, необходимым для того, чтобы при операции записи головка (точнее, обслуживающая ее схема) могла успеть переключиться из режима чтения (заголовка) в режим записи (данных). Сектор завершается контрольным кодом поля данных — контроль с помощью циклического избыточного кода) или ЕСС обнаружением и коррекцией ошибок. СКС-код позволяет только обнаруживать ошибки, а ЕСС-код — еще и исправлять ошибки небольшой кратности. В межсекторных промежутках может размещаться сервоинформация, служащая для точного наведения головки на трек.

Современные жесткие диски внутренне могут быть организованы несколько иначе, чем в вышеописанной схеме. Индексные датчики теперь не используются — начало трека определяется из считываемого сигнала. Физическая разбивка на секторы (по 512 байт данных, которым предшествует идентификатор) может отсутствовать — группа секторов трека представляет собой единый битовый поток, защищенный избыточным кодированием, из которого вычисляется блок данных, находящийся в требуемой позиции (так называемый ID-less format). Для коррекции данных применяются избыточные коды Рида-Соломона, позволяющие большинство ошибок исправлять «на лету», не требуя повторного считывания.блока данных и дополнительного оборота диска.

Для того чтобы диск можно было использовать для записи и считывания информации, он должен быть отформатирован. Форматирование может разделяться на два уровня.

1. Низкоуровневое форматирование (LLF— Low Level Formatting) — форматирование заголовков и пустых (расписанных заполнителем) полей данных всех секторов всех треков. При форматировании выполняется и верификация (проверка читаемости) каждого сектора, и в случае обнаружен неисправимых ошибок считывания в заголовке сектора делается помет о его дефектности.

2. Форматирование верхнего уровня заключается в формировании логической структуры диска (таблиц размещения файлов, корневого катале и т. п.,), соответствующее файловой подсистеме применяемой ОС. Эта процедура выполнима только после низкоуровневого форматирования.

Итак, структура трека — последовательность секторов — задается при его форматировании, а начало трека определяется контроллером по сигналу от и индексного датчика или иным способом.

Нумерация секторов, которая задается контроллеру при форматировании, может быть достаточно произвольной — важно лишь, чтобы все секторы трека имели уникальные номера в пределах допустимого диапазона.

При обращении к сектору он ищется по идентификатору, а если за оборот диска (или за несколько оборотов) сектор с указанным номером не будет найден, контроллер зафиксирует ошибку Sector not found (сектор не найден). Забота о поиске сектора по его заголовку, помещение в его поле даннь записываемой информации, снабженной контрольным кодом, а также считывание этой информации и ее проверка с помощью СКС- или ЕСС-кода лежит на контроллере накопителя. И конечно же, контроллер управляет поиском затребованного цилиндра и коммутацией головок, выбирая нужный трек.

Выбор системы хранения данных бюджетного игрового компьютера с практическими иллюстрациями

Как уже неоднократно было сказано и не только нами, несмотря на преимущества твердотельных накопителей перед традиционными механическими винчестерами в производительности, используются они до сих пор весьма ограничено из-за все еще существенно более высокой стоимости хранения информации. Впрочем, в ряде случаев проблем это не вызывает — например, в офисном компьютере или рабочем ноутбуке класса «пишмашинка+интернет» непаханые гектары дискового пространства попросту не нужны. Соответственно, хватает и маленького SSD, а стоят такие на данный момент сопоставимо с самыми маленькими винчестерами. Понятно, что в абсолютном исчислении это очень разные «самые маленькие», но, когда достаточно и того, и другого, значения это не имеет. Разная производительность при примерно равной цене — наоборот.

Также неплохо дела обстоят в сегменте бюджетных компьютеров, являющихся наследниками нетбуков и неттопов — в них очень часто применяются «планшетные» платформы, не всегда вообще поддерживающие «стандартные» интерфейсы. eMMC в определенной степени производительность снижает, но не до уровня «механики». А что емкость маленькая — так эти компьютеры редко оказываются единственными в хозяйстве: покупают их дополнительно к «нормальным» компьютерам, на которые в итоге и возлагается почетная особенность хранить данные для всех.

Соответственно, в типовом домашнем (в отличие от офисного) десктопе без накопителей высокой емкости пока еще обойтись удается редко. А то и вообще никогда, поскольку не все данные можно вытеснить на NAS даже при его наличии. Особенно страдают от этого игровые компьютеры, поскольку современные игры уже занимают десятки гигабайт дискового пространства, а их у активного игрока может быть установлено и несколько. К тому же, нужно хранить и другие данные, причем не только «свои», а иногда и резервные копии с «дополнительных» компьютеров прочих членов семьи, что приводит к необходимости установки в компьютер накопителя, емкостью не менее одного терабайта. Лучше, даже, больше — но точно не меньше.

Твердотельный накопитель такой емкости и сейчас стоит достаточно дорого, а ведь это, повторимся, минимум, наиболее типичный для бюджетного компьютера. Да и в не совсем бюджетном может оказаться не к месту с точки зрения распределения бюджета: терабайтный SSD в паре с видеокартой на базе GeForce GTX 1060 (в самой дешевой модификации — с 3 ГБ видеопамяти) в московской рознице на момент написания статьи стоил примерно столько же, сколько и GTX 1070 с винчестером на 3 ТБ. Дальше простая арифметика: 3 ТБ ровно в три раза больше, чем 1 ТБ, а частоту кадров в играх SSD не повысит совсем, так что второй вариант в играх (при соответствующей прочей начинке, конечно) будет работать в среднем раза в полтора быстрее. Игровой комфорт может повыситься из-за более быстрой загрузки уровней, но тут нас подстерегает другая проблема: производители программного обеспечения учитывают факт наличия в большинстве компьютеров только лишь винчестера — и оптимизируют свои продукты именно под «медленные» накопители (чтоб пользователь не скучал при переходе из локации в локацию, могут, например, вставить между ними неотключаемый видеоролик). Из-за этого приобретение «быстрого» и дорогого накопителя может не обеспечить того эффекта, на который рассчитывал покупатель. При прочих равных — хорошая покупка, но не ценой экономии на более важных компонентах, типа видеокарты (самая важная деталь игрового ПК), процессора (который должен загружать ее работой), памяти (достаточного объема) и т. п.

Но страдания пользователей топовых систем мы сегодня оставим в стороне, а займемся экономными методами решения проблемы. Стандартным способом является использование пары устройств: твердотельного накопителя невысокой емкости для хранения операционной системы и основных приложений, и емкого винчестера — для всего остального. Такой подход относительно недорого и весьма эффективен, но тоже не лишен недостатков. В частности, игры при этом придется устанавливать на винчестер (на SSD из-за большого размера не поместятся), так что никакого ускорения (даже минимального) и не будет. Да и привычки придется немного менять — в частности, не держать на рабочем столе пару сезонов любимого сериала, чем многие грешат, привыкнув к единственному накопителю большой емкости. Либо систему придется тонко настраивать, чтобы собрать все плюсы, но избежать минусов. Впрочем, того, что винчестер так и останется большим, но медленным накопителем, избежать не удастся.

Альтернативным подходом является использование кэширования — когда быстрый твердотельный накопитель работает в паре с медленным и емким винчестером, а данные распределяются по ним автоматически: под управлением программного обеспечения. Итогом является то, что винчестер «разгружается» от неудобных для механики нагрузок — хотя бы потому, что не приходится «отвлекаться» на модификацию системных данных. Кроме того, немалая часть кода собственно операционной системы, да и приложений в этом случае оказывается именно на твердотельном накопителе — пользователю об этом не приходится заботиться. При этом слишком уж много места для этого не требуется — не секрет, что современное ПО «распухает» зачастую за счет универсальности, так что к каким-то файлам при конкретной работе на конкретной системе обращения могут быть редкими. Вплоть до полного их отсутствия на протяжении дней, недель, месяцев… вообще никогда 🙂 Соответственно, расходовать под них «дорогое» дисковое пространство и не нужно — полежат на «дешевом».

Все эти вопросы мы затрагивали при теоретическом знакомстве с технологией ускорения системы Optane Memory, а также изучая ее на практике на примере мини-ПК NUC и приложений из нашего тестового набора. Пришли к выводу, что работает она неплохо, причем так, как и было обещано производителем. Поэтому сегодня мы решили еще немного «продвинуться» в изучении вопроса — при помощи другого «железа» и «софта».

Объект тестирования

Что касается первого, то мы обратились к компании «Юлмарт» и получили от нее один из компьютеров линейки MicroXperts. Это недорогая модель, снабженная, тем не менее, дискретной видеокартой на базе GeForce GTX 1050, что позволяет играть на ней и во многие современные игры. А не самые современные — и подавно: в любом случае, это уровень, которого вряд ли скоро достигнет любая интегрированная графика. Процессор Core i3-7100 и 8 ГБ памяти этому тоже мешать не будут, но наиболее интересна дисковая система, состоящая из модуля Optane Memory на 16 ГБ и терабайтного винчестера Toshiba P300.

Отметим, что компьютеры этого уровня компания производитель к игровым не относит — они начинаются с GeForce GTX 1050 Ti или AMD Radeon RX 550. Впрочем, это сопоставимый уровень, радикально отличающийся, как уже было сказано, от интегрированных решений. Что же касается дисковой системы, то тут уже возможны варианты. Например, наиболее экономный пользователь наверняка ограничится одним лишь винчестером (как чаще всего и бывает), а стоимость кэширующего модуля потратит на увеличение его емкости до 3 ТБ. Специально тестировать такой вариант смысла не имеет — на производительности он никак не сказывается. Равно как и чисто теоретическим следует признать покупку вместо винчестера и Optane твердотельного накопителя на 240 ГБ — цена примерно та же, производительность другая, но места слишком мало для домашнего десктопа. В принципе, не стоит тестировать и сразу же приходящий на ум «гибрид» из обычного SSD на 80-120 ГБ и того же винчестера — по цене первое сопоставимо с Optane, но винчестер от этого быстрее работать не станет, так что на нем нужно будет держать не только данные (с соответствующими задержками при доступе к ним), но и объемные приложения устанавливать туда же. В первую очередь игры, поскольку на твердотельный накопитель такой емкости может и одна не влезть (учитывая потребности ОС и прочих программ).

С другой стороны, если немного «пошаманить» с конфигурацией, то без несовместимых с жизнью травм можно «впихнуть» в нее и SSD на ~500 ГБ. При этом придется отказаться не только от Optane и винчестера, но и остановиться на плате с чипсетом Н110 и процессоре линейки Pentium. Для Optane это не подходит, поскольку нужен минимум В250 и Core i3, но вот последние в «седьмом» поколении не слишком отличаются от Pentium, а «классический подход» такие вольности допускает. Собственно, поэтому, как нам кажется, после перехода производителей Intel на платформу «восьмого» поколения, где Core i3 стали четырехъядерными, популярность Optane подрастет, но пока эти решения не подходят для бюджетных компьютеров.

В общем, поскольку какой-никакой способ при сохранении цены заменить терабайтный винчестер на полутерабайтный SSD существует, мы решили и такой вариант рассмотреть. Отметим, что места на диске все равно будет вдвое меньше, но с этим уже как-то можно жить, а винчестер можно будет добавить и позднее. Поэтому производительность таких конфигураций мы рассмотрим. И для повышения интересности сравнения мы решили подыграть твердотельным накопителям, взяв не слишком бюджетные модели таковых: Intel 545s, Intel 600p и Samsung 960 PRO. Первые, впрочем, в абсолютном исчислении не так уж дороги, но поставленным условиям по цене не слишком удовлетворяют. Последний в компьютерах такого класса оказаться не может, поскольку стоят как половина системного блока. Но для тестов мы вольны и так «перекосить» конфигурацию — чтобы оценить предельный случай в виде одного из самых быстрых SSD на рынке.

Программное обеспечение

Тесты приложений и «стандартные» игровые мы сегодня затрагивать не будем — поскольку они в значительной степени загружают совсем другие компоненты… зависимость производительности от дисковой системы уже известна: не велика. Поэтому в этот раз мы решили зайти чуть с другой стороны, а именно воспользоваться популярными пакетами «тестирования систем»: давно знакомым нам PCMark 8 и относительно новой версией PCMark 10. Да — это «синтетика», использования которой мы стараемся избегать. Но в тестах накопителей таковая все равно обычно используется. Кроме того, Futuremark старается использовать сценарии нагрузки, основанные на реальных приложениях. И охватывает достаточно широкий спектр последних: от запуска браузера Firefox с открытием в нем Facebook до рендеринга в POV-Ray. В общем, при исследовании новых технологий без синтетических тестов обойтись сложно, а насколько стоит доверять их результатам — каждый решает сам. В первом приближении это просто еще один источник информации, а чем их больше — тем она полнее.

Другое ПО нам сегодня не потребуется. За исключением, конечно, операционной системы Windows 10 Home x64 и драйверов устройств — последних версий на момент тестирования.

PCMark 8 Storage 2.0

Напомним, что в седьмой версии пакета чисто синтетических тестов было достаточно много, однако в восьмой остались только тесты накопителей, которые как раз нам сегодня пригодятся.

В принципе, ничего нового — как уже было отмечено, с точки зрения выполнения дисковых трасс PCMark 7/8 с реальными задержками от ПО и прочих компонентов компьютера, все твердотельные накопители примерно равны, а винчестеры — намного медленнее их. И уже различаются по производительности, поскольку сами часто и оказываются «узким местом» в выбранных сценариях. При этом, как и ожидалось, использование кэширования выводит результаты на уровень «классических» SSD. Даже дорогих. И при большей емкости.

«Пропускная способность» — результат, который показывает, как могло бы быть, если бы было, как хотелось. Иными словами, если бы работе накопителей не мешал весь остальной компьютер вместе с пользователем 🙂 И здесь разные SSD демонстрируют очень разные результаты, но и интереснее то, что «откэшированный» Toshiba P300 две модели из трех вообще обогнал. Сам же по себе он показывает — чего можно ждать от недорогого винчестера: лучшие современные модели в этом тесте в полтора-два раза быстрее. Хотя этого все равно недостаточно для какой-то конкуренции с «гибридной» или «твердотельной» СХД. Если, конечно, рассматривать ее быстродействие в чистом виде — без учета прочих факторов.

PCMark 8 Home 3.0 и Creative 3.0

Первый тест предназначен для оценки производительности систем, на которых запускаются задачи, типичные для домашних пользователей, второй уже чуть сложнее, поскольку включает задачи обработки фото и видео и т. п. Словом, не только потребление контента, но и его производства.

В обоих случаях тестируемые системы, различающиеся только накопителем, разделяются на две неравных группы: в одной — одиночный винчестер, во второй — все остальные. Правда вот разница между ними невелика, что абсолютно не похоже на дисковые тесты. Но это и понятно — если, например, в задачах Video Chat и Video Group Chat проверяется способность системы обеспечить частоту 30 кадров в секунду в видеоконференции (1:1 или групповой), то и результат всюду оказывается одинаковым. На самом деле, эта нагрузка уже достаточно «легка» и для современных планшетов, не говоря уже о десктопах (пусть даже «базового домашнего» уровня). А накопитель на ней в принципе сказаться не может.

Отметим, что в тестах по «стандартной» методике мы получили аналогичный разброс результатов — даже немного меньший. Это объясняется более тяжелой нагрузкой на процессор, в итоге чего вклад других систем компьютера уменьшается. Собственно, одна из причин того, почему некоторые пользователи все еще с недоверием относятся к SSD — стоит дороже, а скорость работы компьютера повышает не всегда и не всегда значительно. И вот в этом смысле кэширующие технологии, «научившиеся» расшивать «узкое место» в механике, могут оказаться очень полезны — из-за меньшей суммарной стоимости хранения информации (пусть и чуть более высокой, чем у одиночного винчестера).

Поскольку изучаемый компьютер в некоторой степени ориентирован и на игровое применение, вынесем и результаты этой части теста Creative 3.0 на диаграмму. Понятно, что частота кадров от накопителя не зависит, да и нагрузка легковата для современных дискретных видеокарт (даже недорогих), но мы просто отметим, что один из лучших на сегодня интегрированных GPU Iris Plus 650 (в процессоре Core i7-7567U) в этих тестах работает в три раза медленнее, а массовые интеграшки, разумеется, еще хуже. Более подробно же производительность GeForce GTX 1050 и других решений изучается в другом разделе сайта; мы же просто повторим, что на сегодня эта модель относится к базовому уровню для более-менее игрового ПК. Впрочем, наш сегодняшний герой таковым формально не является, относясь к группе «домашних», но он, хотя бы, что-то может.

PCMark 10 Extended

Отметим, что новая версия пакета стала компактнее, тестирование компьютера с ее помощью занимает меньшее время (хотя повторяемость результатов осталась очень высокой), а «чистой синтетики» фактически вообще не осталось — только сценарии на основе реальных приложений. В общем, для тщательного изучения компонентов системы подходит она плохо, а для быстрой оценки производительности и сравнения ее с другими компьютерами — может пригодиться.

Да и результаты неплохо коррелируют с другими тестами — неважно, на каком принципе основанными. В частности, мы опять видим две неравные группы и разницу в производительности порядка 15% в целом: в новом пакете для удобства «использования в быту» есть общий интегральный балл.

А есть и отдельные по группам. В частности, Essentials — базовые сценарии работы, с которыми сталкивается каждый пользователь. Опять мы видим две неравные группы (что уже стало привычным), но разница между ними увеличилась. Что объяснимо — в этот набор входят и тесты запуска приложений.

И вот тут отставание одиночного винчестера от прочих двукратное, а в остальном распределение ролей между ними похоже на Bandwidth из PCMark 8 Storage 2.0. В PCMark 7 же результаты воспроизведения трассы «Starting Application» на винчестерах и SSD различались на порядок (в нормальном режиме — в RAW на два). Почему сейчас мы не видим такой радикальной разницы? Новая версия пакета ориентирована на использование с современными версиями Windows и имитирует их работу. В частности, есть тесты не только на «холодный» запуск с чтением всей нужной информации непосредственно с накопителя, но и «горячий» — когда нередко можно получить заметный выигрыш от технологий типа SuperFetch и подобных. Естественно, наибольший эффект от них наблюдается на самых медленных накопителях. Но, как видим, разница между винчестерами и SSD все равно остается двукратной. А вот использование кэширования позволяет ее нивелировать.

Но не всегда что-то требуется нивелировать — в очередной раз при «тяжелых» для компьютера нагрузках по созданию контента разброс значений между привычными группами составляет менее 10%. Впрочем, так и должно быть — потому повторение данной ситуации мы и видим раз за разом в разных программах. Главное, чтоб характер генерируемой ими нагрузки был сходным. Но POV-Ray сам по себе (в нашей методике, например) или в качестве одного из модулей PCMark 10 — это один и тот же POV-Ray, которому в первую очередь нужен быстрый центральный процессор, а потом уже все остальное.

Что оказалось немного неожиданным, так это то, что группа «легкой офисной работы» (куда входит набор текстов, да редактирование электронных таблиц) ведет себя не похожим на другие группы образом: здесь есть заметная разница между винчестером и твердотельными накопителями, а вот кэширование расположилось между ними. С другой стороны, это объяснимо — если постоянно работать с каким-то файлом, есть большая вероятность, что он рано или поздно окажется в кэше. А если нет — останется на винчестере. Вот этот случай как раз в тесте и наблюдается: прирост от Optane Memory есть, но не до уровня твердотельных накопителей. Что ж — тем правильнее идея использовать в офисных компьютерах именно SSD. Как ни парадоксально это звучит, но с учетом потребных им емкостей, это может обойтись даже дешевле винчестера 🙂 А вот когда требуется много дискового пространства и недорого, придется идти на компромиссы. Тем более, что производительность сравнительно с одиночным винчестером все-таки повышается.

Вместо абстрактных игровых тестов в предыдущей версии пакета, в «десятку» просто встроили Fire Strike из 3DMark, что и правильно — этим пакетом пользуются многие, так что результаты всегда можно сравнить с разными обзорами, например. У нас получилось ниже, чем «стандартные» для обзоров цифры, что объяснимо и тем, что вся система более соответствует уровню данной видеокарты, а часть тестов от ее производительности зависит. «Чистый» же графический балл — во всех конфигурациях ~7000, что от 1050 и ожидалось 🙂 Сегодня же нам важнее то, что как он, так и общий результат никоим образом от дисковой системы не зависит, почему на последней в бюджетных (да и не совсем бюджетных) игровых компьютерах регулярно и экономят. Но вот все остальные сценарии убедительно показывают, что слишком уж экономить — не стоит, благо появились удачные компромиссные решения.

Итого

Сегодня мы решили взглянуть на вопрос производительности дисковой системы компьютера с немного другого ракурса, чем обычно — но в целом результаты оказались уже привычными. Во-первых, разница в производительности между винчестерами и твердотельными накопителями есть практически всегда, но она тем меньше, чем большая нагрузка приходится на другие компоненты компьютера. Частота кадров в играх, например, и вовсе не зависит от СХД, что неоднократно было проверено в самих играх — так что странным было бы ожидать обратного от игровых тестов PCMark 🙂

Во-вторых, заметной разницы между твердотельными накопителями разной стоимости в бытовых (да и вообще персональных) сценариях практически нет — это тоже давно известный результат, который в очередной раз подтвердился. Соответственно, можно говорить об двух уже заметно отличающихся по производительности раскладах — любой винчестер или любой SSD. При этом Optane Memory позволяет практически всегда дотянуться до второго. Не всегда, но практически всегда. И, в любом случае, получить больше, чем от одиночного винчестера. Причем, в отличие от «раздельной» тактики — с покупкой маленького твердотельного накопителя чисто для системы и части программ, не требуется как-то менять привычки и что-то настраивать, поскольку ускоряется весь «гибридизированный накопитель». И (что тоже очень важно) Optane Memory можно добавить к готовой системе без каких-либо проблем. В принципе, от последней требуется только наличие чипсета Intel B250 (и выше) и процессора Intel Core i3-7100 и выше. Да — это достаточно новое «железо», но его за последний год уже было немало продано. И будет еще продаваться. А скоро в бюджетный сегмент начнут поступать и процессоры «восьмого» поколения с соответствующими чипсетами, где младший Core i3 уже более привлекателен (в «седьмом», как уже было сказано, он был слишком похож на Pentium). Все это можно будет немного ускорить посредством кэширования — не обязательно сразу, но, конечно, не слишком затягивая. Что, опять же, очень важно для бюджетного сегмента (и особенно бюджетного игрового) — все-таки что-то добавлять к компьютеру проще, чем менять. Особенно если за эту процедуру активно возьмутся сами производители компьютеров. Какое-то количество последних продавая и сразу с модулем Optane Memory — младшая его модификация работает адекватно, стоит недорого и никаких неудобств покупателю не приносит, поскольку он все так же «видит» один большой накопитель, как и в случае одиночного винчестера. Только более производительный, что немаловажно.

В заключение предлагаем посмотреть наш видеообзор по этому материалу:

Также этот видеообзор можно посмотреть на iXBT.Video

Современные технологии дисковых систем хранения данных

В этой статье речь пойдет о системах хранения данных начального и среднего уровня, а также тех тенденциях, которые сегодня ярко выделяются в этой отрасли. Для удобства будем называть системы хранения данных накопителями.

Сначала мы немного остановимся на терминологии и технологических основах автономных накопителей, а потом перейдём к новинкам и обсуждению современных достижений в разных технологических и маркетинговых группах. Мы также обязательно расскажем о том, зачем нужны системы того или иного вида и насколько эффективным является их использование в разных ситуациях.

Автономные дисковые подсистемы

Для того, чтобы лучше понять особенности автономных накопителей, остановимся немного на одной из более простых технологий построения систем хранения данных — шинно-ориентированной технологии. Она предусматривает использование корпуса для дисковых накопителей и контроллера PCI RAID.

Рисунок 1. Шинно-ориентированная технология постоения систем хранения данных

Таким образом, между дисками и PCI-шиной хоста (от англ. Host — в данном случае автономный компьютер, например сервер или рабочая станция) есть только один контроллер, который в значительной мере и задает быстродействие системы. Накопители, построенные по этому принципу, являются наиболее производительными. Но в связи с архитектурными особенностями практическое их использование, за исключением редких случаев, ограничивается конфигурациями с одним хостом.

К недостаткам шинно-ориентированной архитектуры накопителей следует отнести:

эффективное использование только в конфигурациях с одним хостом;
зависимость от операционной системы и платформы;
ограниченную масштабируемость;
ограниченные возможности по организации отказоустойчивых систем.

Естественно, всё это неважно, если данные нужны для одного сервера или рабочей станции. Наоборот, в такой конфигурации вы получите максимальное быстродействие за минимальные деньги. Но если вам нужна система хранения данных для большого вычислительного центра или даже для двух серверов, которым нужны одни и те же данные, шинно-ориентированная архитектура совершенно не подходит. Недостатков этой архитектуры позволяет избежать архитектура автономных дисковых подсистем. Основной принцип ее построения достаточно прост. Контроллер, который управляет системой, переносится из хост-компьютера в корпус накопителя, обеспечивая независимое от хост-систем функционирование. Следует отметить, что такая система может иметь большое количество внешних каналов ввода/вывода, что обеспечивает возможность подключения к системе нескольких, или даже многих компьютеров.

Рисунок 2. Автономная система хранения данных

Любая интеллектуальная система хранения данных состоит из аппаратной части и программного кода. В автономной системе всегда есть память, в которой хранится программа алгоритмов работы самой системы и процессорные элементы, которые этот код обрабатывают. Такая система функционирует независимо от того, с какими хост-системами она связана. Благодаря своей интеллектуальности автономные накопители зачастую самостоятельно реализуют множество функций по обеспечению сохранности и управлению данными. Одна из самых важных базовых и практически повсеместно используемых функций — это RAID (Redundant Array of Independent Disks). Другая, принадлежащая уже системам среднего и высокого уровня — это виртуализация. Она обеспечивает такие возможности как мгновенная копия или удаленное резервирование, а также другие, достаточно изощрённые алгоритмы.

Коротко о SAS, NAS, SAN

В рамках рассмотрения автономных систем хранения данных обязательно следует остановиться на том, каким образом осуществляется доступ хост-систем к накопителям. Это в значительной мере определяет сферы их использования и внутреннюю архитектуру.

Различают три основных варианта организации доступа к накопителям:

SAS (Server Attached Storage) — накопитель, подсоединенный к серверу [ второе название DAS (Direct Attached Storage) — напрямую подсоединённый накопитель ];
NAS (Network Attached Storage) — накопитель, подсоединенный к сети;
SAN (Storage Area Network) — сеть хранения данных.

Мы уже писали о технологиях SAS/DAS, NAS и SAN в статье посвященной SAN, если кого эта информация заинтересует, рекомендуем обратиться к страницам iXBT. Но всё же позволим себе немножко освежить материал с акцентом на практическое использование.

SAS/DAS — это достаточно простой традиционный способ подключения, который подразумевает прямое (отсюда и DAS) подсоединение системы хранения к одной или нескольким хост-системам через высокоскоростной канальный интерфейс. Часто в таких системах, для подсоединения накопителя к хосту используется такой же интерфейс, который используется для доступа к внутренним дискам хост-системы, что в общем случае обеспечивает высокое быстродействие и простое подключение.

SAS-систему можно рекомендовать к использованию в случае, если имеется потребность в высокоскоростной обработке данных больших объемов на одной или нескольких хост-системах. Это, например, может быть файл-сервер, графическая станция или отказоустойчивая кластерная система, состоящая из двух узлов.

Рисунок 3. Кластерная система с общим накопителем

NAS — накопитель, который подсоединен к сети и обеспечивает файловый (обратите внимание — файловый, а не блочный) доступ к данным для хост-систем в сети LAN/WAN. Клиенты, которые работает с NAS, для доступа к данным обычно используют протоколы NSF (Network File System) или CIFS (Common Internet File System). NAS интерпретирует команды файловых протоколов и исполняет запрос к дисковым накопителям в соответствии с используемым в нём канальным протоколом. Фактически, архитектура NAS — это эволюция файловых серверов. Главным преимуществом такого решения является быстрота развёртывания и качество организации доступа к файлам, благодаря специализации и узкой направленности.

Исходя из сказанного, NAS можно рекомендовать для использования в случае, если нужен сетевой доступ к файлам и достаточно важными факторами являются: простота решения (что обычно является неким гарантом качества) и простота его сопровождения и установки. Прекрасным примером является использование NAS в качестве файл-сервера в офисе небольшой компании, для которой важна простота установки и администрирования. Но в то же время, если вам нужен доступ к файлам с большого количества хост-систем, мощный NAS-накопитель, благодаря отточенному специализированному решению, способен обеспечить интенсивный обмен трафиком с огромным пулом серверов и рабочих станций при достаточно низкой стоимости используемой коммуникационной инфраструктуры (например, коммутаторов Gigabit Ethernet и медной витой пары).

SAN — сеть хранения данных. Обычно в SAN используется блочный доступ к данным, хотя возможно подключение к сетям хранения данных устройств, предоставляющих файловые сервисы, например NAS. В современных реализациях сети хранения данных чаще всего используют протокол Fibre Channel, но в общем случае это не является обязательным, в связи с чем, принято выделять отдельный класс Fibre Channel SAN (сети хранения данных на основе Fibre Channel).

Основой SAN является отдельная от LAN/WAN сеть, которая служит для организации доступа к данным серверов и рабочих станций, непосредственно занимающихся обработкой. Такая структура делает построение систем с высокой готовностью и высокой интенсивностью запросов относительно простой задачей. Несмотря на то, что SAN сегодня остается дорогим удовольствием, TCO (общая стоимость владения) для средних и больших систем, построенных с использованием технологии сетей хранения данных, является довольно низкой. Описание способов снижения TCO корпоративных систем хранения данных благодаря SAN можно найти на страницах ресурса techTarget: http://searchstorage.techtarget.com.

Сегодня стоимость дисковых накопителей с поддержкой Fibre Channel, как наиболее распространенного интерфейса для построения SAN, близка к стоимости систем с традиционными недорогими канальными интерфейсами (такими как параллельный SCSI). Главными стоимостными составляющими в SAN остается коммуникационная инфрастуктура, а также стоимость ее развёртывания и сопровождения. В связи с чем, в рамках SNIA и многих коммерческих организациях ведётся активная работа над технологиями IP Storage, что позволяет использовать значительно более недорогую аппаратуру и инфраструктуру IP-сетей, а также колоссальный опыт специалистов в этой сфере.

Примеров по эффективному использованию SAN можно привести достаточно много. Практически везде, где имеется необходимость использования нескольких серверов с совместной системой хранения данных, можно использовать SAN. Например, для организации коллективной работы над видеоданными или предварительной обработки печатной продукции. В такой сети каждый участник процесса обработки цифрового контента получает возможность практически одновременно работать над Терабайтами данных. Или, например, организация резервирования больших объемов данных, которыми пользуется множество серверов. При построении SAN и использовании независимого от LAN/WAN алгоритма резервирования данных и технологий «моментальной копии», можно резервировать почти любые объёмы информации без ущерба функциональности и производительности всего информационного комплекса.

Fibre Channel в сетях хранения данных

Безусловным фактом является то, что сегодня именно FC (Fibre Channel) доминирует в сетях хранения данных. И именно развитие этого интерфейса привело к развитию самой концепции SAN.

В проектировании FC принимали участие специалисты со значительным опытом в разработке как канальных, так и сетевых интерфейсов, и им удалось объединить все важные положительные черты обоих направлений. Одним из важнейших преимуществ Fibre Channel наряду со скоростными параметрами (которые, кстати, не всегда являются главными для пользователей SAN, и могут быть реализованы с помощью других технологий) является возможность работы на больших расстояниях и гибкость топологии, которая пришла в новый стандарт из сетевых технологий. Таким образом, концепция построения топологии сети хранения данных базируется на тех же принципах, что и традиционные локальные сети, на основе концентраторов, коммутаторов и маршрутизаторов, что значительно упрощает построение многоузловых конфигураций систем, в том числе без единой точки отказов.

Стоит также отметить, что в рамках Fibre Channel для передачи данных используются как оптоволоконные, так и медные среды. При организации доступа к территориально удаленным узлам на расстоянии до 10 киллометров используется стандартная аппаратура и одномодовое оптоволокно для передачи сигнала. Если же узлы разнесены на 10-ки или даже 100-ни километров используются специальные усилители. При построении таких SAN учитываются достаточно нетрадиционные для систем хранения данных параметры, например, скорость распространения сигнала в оптоволокне.

Тенденции развития систем хранения данных

Мир систем хранения данных чрезвычайно разнообразен. Возможности систем хранения данных, так и стоимость решений достаточно дифференцирована. Существуют решения, объединяющие в себе возможности обслуживания сотен тысяч запросов в секунду к десяткам и даже сотням Терабайт данных, а также решения для одного компьютера с недорогими дисками с IDE-интерфейсом.

IDE RAID

В последнее время максимальный объем дисков с IDE-интерфейсом колоссально увеличился и опережает SCSI-диски примерно в два раза, а если говорить о соотношении цена на единицу объёма, то IDE-диски лидируют с разрывом более чем в 6 раз. Это, к сожалению, не повлияло положительно на надежность IDE-дисков, но всё же сфера их применения в автономных системах хранения данных неумолимо увеличивается. Главным фактором в этом процессе является то, что потребность в больших объёмах данных растёт быстрее, чем объем одиночных дисков.

Еще несколько лет назад редкие производители решались выпускать автономные подсистемы, ориентированные на использование IDE-дисков. Сегодня их выпускает практически каждый производитель, ориентированный на рынок систем начального уровня. Наибольшее распространение в классе автономных подсистем с IDE-дисками наблюдается в NAS-системах начального уровня. Ведь если вы используете NAS в качестве файлового сервера с интерфейсом Fast Ethernet или даже Gigabit Ethernet, то в большинстве случаев быстродействия таких дисков является более чем достаточным, а их низкая надёжность компенсируется использованием технологии RAID.

Там, где необходим блочный доступ к данным при минимальной цене за единицу хранимой информации, сегодня активно используются системы с IDE-дисками внутри и с внешним SCSI-интерфейсом. Например, на системе JetStor IDE производства американской компании AC&NC для построения отказоустойчивого архива с объёмом хранимых данных в 10 Терабайт и возможностью быстрого блочного доступа к данным стоимость хранения одного Мегабайта будет составлять меньше 0,3 цента.

Ещё одной интересной и достаточно оригинальной технологией, с которой пришлось познакомиться совсем недавно, была система Raidsonic SR-2000 с внешним параллельным IDE-интерфейсом.

Рисунок 4. Автономный IDE RAID начального уровня

Это автономная дисковая система, рассчитанная на использование двух IDE дисков и ориентированная на монтаж внутри корпуса хост-системы. Она абсолютно независима от операционной системы на хост-машине. Система позволяет организовать RAID 1 (зеркало) или просто копирование данных с одного диска на другой с возможностью горячей замены дисков, без какого-либо ущерба или неудобства со стороны пользователя компьютера, чего не скажешь о шинно-ориентированых подсистемах, построенных на контроллерах PCI IDE RAID.

Следует заметить, что ведущие производители IDE-дисков анонсировали выпуск дисков среднего класса с интерфейсом Serial ATA, в которых будут использоваться высокоуровневые технологии. Это должно благоприятно повлиять на их надежность и увеличить долю ATA-решений в системах хранения данных.

Что нам принесёт Serial ATA

Первое и самое приятное, что можно найти в Serial ATA — это кабель. В связи с тем, что интерфейс ATA стал последовательным, кабель стал круглым, а коннектор — узким. Если вам приходилось укладывать кабели параллельного IDE-интерфейса в системе на восемь IDE-каналов, я уверен, что вам понравится эта особенность. Конечно, уже давно существовали круглые IDE-кабели, но коннектор у них всё же оставался широким и плоским, да и максимально допустимая длина параллельного ATA-кабеля не радует. При построении систем с большим количеством дисков, наличие стандартного кабеля вообще не сильно помогает, так как кабели приходится делать самостоятельно, и при этом их укладка становится едва ли не главной по времени задачей при сборке.

Кроме особенности кабельной системы, в Serial ATA есть другие нововведения, которые для параллельной версии интерфейса реализовать самостоятельно с помощью канцелярского ножа и другого подручного инструмента не удастся. В дисках с новым интерфейсом скоро должна появиться поддержка набора инструкций Native Command Queuing (конвейеризации команд). При использовании Native Command Queuing, контроллер Serial ATA анализирует запросы ввода-вывода и оптимизирует очередность их выполнения таким образом, чтобы минимизировать время поиска. Достаточно очевидна схожесть идеи Serial ATA Native Command Queuing с организацией очереди команд в SCSI, правда, для Serial ATA будет поддерживаться очередь до 32 команд, а не традиционных для SCSI — 256. Появилась также родная поддержка горячей замены устройств. Конечно, такая возможность существовала и ранее, но её реализация была за рамками стандарта и, соответственно, не могла получить широкое распространение. Говоря о новых скоростных возможностях Serial ATA, следует заметить, что сейчас от них радости пока большой нет, но главное здесь то, что на будущее есть хороший Roadmap, реализовать который в рамках параллельного ATA было бы очень не просто.

Учитывая сказанное, можно не сомневаться, что доля ATA-решений в системах хранения начального уровня должна увеличиться именно за счёт новых дисков Serial ATA и систем хранения данных, ориентированных на использование таких устройств.

Куда идет параллельный SCSI

Все, кто работает с системами хранения данных, даже начального уровня, вряд ли могут сказать, что им нравятся системы с IDE-дисками. Главное преимущество ATA дисков — их низкая цена, по сравнению со SCSI-устройствами ну и еще, наверное, более низкий уровень шума. И происходит всё это по простой причине, так как SCSI-интерфейс лучше подходит для использования в системах хранения данных и пока значительно дешевле, чем еще более функциональный интерфейс — Fibre Channel, то и диски со SCSI-интерфейсом производятся более качественные, надёжные и быстрые, чем с дешёвым IDE-интерфейсом.

Сегодня многие производители при проектировании систем хранения с параллельным SCSI используют Ultra 320 SCSI, самый новый интерфейс в семействе. Некогда во многих Roadmap были планы по выпуску устройств с интерфейсом Ultra 640 и даже Ultra 1280 SCSI, но всё шло к тому, что в интерфейсе нужно что-то менять кардинальным образом. Параллельный SCSI уже сейчас, на этапе использования Ultra 320, многих не устраивает, главным образом по причине неудобства использования классических кабелей.

К счастью, недавно появился новый интерфейс Serial Attached SCSI (SAS). У нового стандарта будут интересные особенности. Он объединяет в себе некоторые возможности Serial ATA и Fibre Channel. Несмотря на эту странность, следует сказать, что в таком переплетении есть некий здравый смысл. Стандарт возник на основе физических и электрических спецификаций последовательного ATA с такими усовершенствованиями, как увеличение уровня сигнала для соответствующего увеличения длинны кабеля, увеличение максимальной адресуемости устройств. А самое интересное то, что технологи обещают обеспечить совместимость устройств Serial ATA и SAS, но только в следующих версиях стандартов.

К наиболее важным особенностям SAS можно отнести:

интерфейс точка-точка;
двухканальный интерфейс;
поддержка 4096 устройств в домене;
стандартный набор команд SCSI;
кабель длинной до 10 метров;
кабель 4-жильный;
полный дуплекс.

Благодаря тому, что новый интерфейс предлагает использовать такой же миниатюрный коннектор, как и Serial ATA, у разработчиков появляется новая возможность по построению более компактных устройств с высокой производительностью. Стандарт SAS также предусматривает использование расширителей. Каждый расширитель будет поддерживать адресацию 64-х устройств с возможностью каскадирования до 4096 устройств в рамках домена. Это конечно значительно меньше, чем возможности Fibre Channel, но в рамках систем хранения начального и среднего уровней, с накопителями, напрямую подсоединенными к серверу, этого вполне достаточно.

Несмотря на все прелести, интерфейс Serial Attached SCSI вряд ли быстро заместит обычный параллельный интерфейс. В мире решений для предприятий разработки обычно ведутся более тщательно и, естественно, в течение большего времени, чем для настольных систем. Да и уходят старые технологии не очень быстро, так как период, за который они отрабатывают себя, тоже немаленький. Но всё же, в году 2004 устройства с интерфейсом SAS должны выйти на рынок. Естественно, сначала это будут в основном диски и PCI-контролеры, но ещё через годик подтянутся и системы хранения данных.

Для лучшего обобщения информации предлагаем ознакомиться со сравнением современных и новых интерфейсов для систем хранения данных в виде таблицы.

Параметры	Serial ATA	SCSI	SAS	FC
Число адресуемых устройств	16	16	4096	2²⁴
Расстояние, м	1м	12м	10м	медь: 30м оптика: 104м¹
Топология соединения устройств	точка-точка	шина	точка-точка	кольцо², точка-точка
Скорость, Мбайт/с	150; 300	320;	150; 300;	100; 200; 400;
Полный дуплекс	Нет	Нет	Да	Да
Протоколы	ATA, SCSI⁴	SCSI	ATA, SCSI	независимый³
Поддержка двухпортовых устройств	Нет	Нет	Да	Да

¹ — Стандарт регламентирует расстояние до 10 км для одномодового оптоволокна, существуют реализации устройств для передачи данных на расстояние больше чем, 105 м.
² — В рамках внутренней виртуальной топологии кольца работают концентраторы и некоторые коммутаторы FC, также существует много реализаций коммутаторов, которые обеспечивают соединение точка-точка любых устройств, подсоединенных к ним.
³ — Cуществуют реализации устройств со SCSI, FICON, ESCON, TCP/I, HIPPI, VI протоколами.
⁴ — Дело в том, что устройства будут взаимно совместимы (так обещают сделать в ближайшем будущем производители). То есть SATA-контроллеры будут поддерживать SAS-диски, а SAS-контроллеры — диски SATA.

Массовое увлечение NAS

Последнее время за рубежом отмечается просто-таки массовое увлечение NAS-накопителями. Дело в том, что с увеличением актуальности ориентированного на данные подхода к построению информационных систем увеличилась привлекательность специализации классических файл-серверов и формирование новой маркетинговой единицы — NAS. При этом опыт в построении подобных систем был достаточным для быстрого старта технологии накопителей, подсоединенных к сети, а стоимость их аппаратной реализации была предельно низкой. Сегодня NAS-накопители производят фактически все производители систем хранения данных, среди них и системы начального уровня за очень маленькие деньги, и среднего, и даже системы, отвечающие за хранение десятков Терабайт информации, способные обработать колоссальное количество запросов. В каждом классе NAS-систем есть свои интересные оригинальные решения.

NAS на основе PC за 30 минут

Мы хотим немного описать одно оригинальное решение начального уровня. О практической ценности его реализации можно спорить, но в оригинальности ему не откажешь.

По сути дела, NAS-накопитель начального уровня, да и не только начального, является достаточно простым персональным компьютером с неким количеством дисков и программной частью, которая обеспечивает доступ других участников сети к данным на файловом уровне. Таким образом, для построения NAS устройства достаточно взять указанные компоненты и соединить их между собой. Все дело в том, насколько качественно вы это сделаете, настолько же надежный и качественный доступ к данным получит рабочая группа, работающая с данными, доступ к которым обеспечивает ваше устройство. Именно учитывая эти факторы, а также время развёртывания решения, плюс некоторые дизайнерские изыскания строится NAS-накопитель начального уровня.

Разница между хорошим NAS-решением начального уровня с самостоятельно собранной и настроенной в рамках выбранной ОС персоналкой, если опять-таки опустить конструктивное исполнение, будет в том:

насколько быстро вы это сделаете;
насколько просто сможет обслуживаться эта система неквалифицированным персоналом;
насколько качественно это решение будет работать и поддерживаться.

Другими словами, в случае профессионального подбора комплектующих и существования некого изначально настроенного набора программного обеспечения, можно достичь хорошего результата. Истина вроде банальная, это же можно сказать о любой задаче, которая решается по схеме готовых компонентных решений: «hardware» плюс «software».

Что предлагает сделать компания «X»? Формируется достаточно ограниченый список совместимых комплектующих: материнских плат со всем интегрированным хозяйством, нужных NAS-серверу начального уровня жёстких дисков. Вы покупаете устанавливаемый в IDE-разъём на материнской плате FLASH диск с записанным программным обеспечением и получаете готовый NAS накопитель. Операционная система и утилиты, записанные на этот диск, загружаясь, конфигурируют нужные модули адекватным образом. И в результате пользователь получает устройство, которое может управляться как локально, так и удаленно через HTML-интерфейс и предоставлять доступ к дисковым накопителям, подключённым к нему.

Файловые протоколы в современных NAS

CIFS (Common Internet File System) — это стандартный протокол, который обеспечивает доступ к файлам и сервисам на удаленных компьютерах (в том числе и в Интернет). Протокол использует клиент-серверную модель взаимодействия. Клиент создает запрос к серверу на доступ к файлам или передачу сообщения программе, которая находится на сервере. Сервер выполняет запрос клиента и возвращает результат своей работы. CIFS — это открытый стандарт, который возник на основе SMB-протокола (Server Message Block Protocol), разработанного Microsoft, но, в отличие от последнего, CIFS учитывает возможность возникновения больших таймаутов, так как ориентирован на использование в том числе и в распределённых сетях. SMB-протокол традиционно использовался в локальных сетях с ОС Windows для доступа к файлам и печати. Для транспортировки данных CIFS использует TCP/IP протокол. CIFS обеспечивает функциональность похожую на FTP (File Transfer Protocol), но предоставляет клиентам улучшенный (похожий на прямой) контроль над файлами. Он также позволяет разделять доступ к файлам между клиентами, используя блокирование и автоматическое восстановление связи с сервером в случае сбоя сети.

NFS (Network File System) — это стандарт IETF, который включает в себя распределенную файловую систему и сетевой протокол. NFS был разработан компанией Sun Microsystem Computer Corporation. Он первоначально использовался только в UNIX-системах, позже реализации клиентской и серверной чатей стали распространенными и в других системах.

NFS, как и CIFS, использует клиент-серверную модель взаимодействия. Он обеспечивает доступ к файлам на удаленном компьютере (сервере) для записи и считывания так, как если бы они находились на компьютере пользователя. В ранних версиях NFS для транспортирования данных использовался UDP-протокол, в современных — используется TCP/IP. Для работы NFS в интерент компанией Sun был разработан протокол WebNFS, который использует расширения функциональности NFS для его корректной работы во всемирной сети.

DAFS (Direct Access File System) — это стандартный протокол файлового доступа, который базируется на NFSv4. Он позволяет прикладным задачам передавать данные в обход операционной системы и ее буферного пространства напрямую к транспортным ресурсам, сохраняя семантику, свойственную файловым системам. DAFS использует преимущества новейших технологий передачи данных по схеме память-память. Его использование обеспечивает высокие скорости файлового ввода-вывода, минимальную загрузку CPU и всей системы, благодаря значительному уменьшению количества операций и прерываний, которые обычно необходимы при обработке сетевых протоколов. Особенно эффективным является использование аппаратных средств поддержки VI (Virtual Interface).

DAFS проектировался с ориентацией на использование в кластерном и серверном окружении для баз данных и разнообразных интернет-приложений, ориентированных на непрерывную работу. Он обеспечивает наименьшие задержки доступа к общим файловым ресурсам и данным, а также поддерживает интеллектуальные механизмы восстановления работоспособности системы и данных, что делает его очень привлекательным для использования в High-End NAS-накопителях.

Все дороги ведут к IP Storage

В системах хранения данных высокого и среднего уровня за последние несколько лет появилось очень много новых интересных технологий.

Fibre Channel сети хранения данных сегодня уже достаточно известная и популярная технология. В то же время, их массовое распространение сегодня является проблематичным из-за ряда особенностей. К ним можно отнести высокую стоимость реализации и сложность построения географически распределённых систем. С одной стороны — это всего лишь особенности технологии уровня предприятия, но с другой, если SAN станет дешевле, и построение распределённых систем упростится, это должно дать просто-таки колоссальный прорыв в развитии сетей хранения данных.

Рассказывая о новых технологиях в сетях хранения данных, мне хотелось бы остановиться на так называемых IP Storage решениях, накопителях, доступ к которым осуществляется с использованием IP-технологий. Более детально о iSCSI можно прочитать здесь — http://www.ixbt.com/storage/iscsi.shtml.

В рамках работы над сетевыми технологиями хранения данных в Internet Engineering Task Force (IETF) была создана рабочая группа и форум IP Storage (IPS) по направлениям:

FCIP — Fibre Channel over TCP/IP, созданный на базе TCP/IP туннельный протокол, функцией которого является соединение географически удаленных FC SAN без какого либо воздействия на FC и IP протоколы.

iFCP — Internet Fibre Channel Protocol, созданный на базе TCP/IP протокол для соединения FC систем хранения данных ли FC сетей хранение данных, используя IP инфраструктуру совместно или вместо FC коммутационных и маршрутизирующих элементов.

iSNS — Internet Storage Name Service, протокол поддержке имён накопителей в сети Интернет.

iSCSI — Internet Small Computer Systems Interface, это протокол, который базируется на TCP/IP и разработан для установления взаимодействия и управления системами хранения данных, серверами и клиентами (Определение SNIA — IP Storage Forum: www.snia.org).

Самым бурно развивающимся и самым интересным из перечисленных направлений является iSCSI.

iSCSI — новый стандарт

11 февраля 2003 года iSCSI стал официальным стандартом. Ратификация iSCSI обязательно повлияет на более широкий интерес к стандарту, который уже развивается достаточно активно. Быстрее всего развитие iSCSI послужит толчком к распространению SAN в малом и среднем бизнесе, так как использование соответствующего стандарту оборудования и подхода к обслуживанию (в том числе распространённого в рамках стандартных Ethernet сетей) позволит сделать сети хранения данных значительно дешевле. Что же касается использования iSCSI в Интернет, то сегодня здесь уже неплохо прижился FCIP, и конкуренция с ним будет трудной.

Новый стандарт охотно поддержали известные IT-компании. Есть, конечно, и противники, но всё же, практически все компании, которые активно участвуют в рынке систем начального и среднего уровня, уже работают над устройствами с поддержкой iSCSI. В Windows и Linux iSCSI драйверы уже включены, системы хранения данных iSCSI производит IBM, адаптеры — Intel, в ближайшее время подключиться к процессу освоения нового стандарта обещают HP, Dell, EMC.

Одной из очень интересных особенностей iSCSI является то, что для передачи данных на накопителе с интерфейсом iSCSI можно использовать не только носители, коммутаторы и маршрутизаторы существующих сетей LAN/WAN, но и обычные сетевые адаптеры Fast Ethernet или Gigabit Ethernet на стороне клиента. Правда, при этом возникают значительные накладные расходы процессорной мощности ПК, который использует такой адаптер. По утверждению разработчиков, программная реализация iSCSI может достичь скоростей среды передачи данных Gigabit Ethernet при значительной, до 100% загрузке современных CPU. В связи с чем рекомендуется использование специальных сетевых карточек, которые будут поддерживать механизмы разгрузки CPU от обработки стека TCP.

Виртуализация в сетях хранения данных

Ёщё одной важной технологией в построении современных накопителей и сетей хранения данных является виртуализация.

Виртуализация систем хранения данных — это представление физических ресурсов в некоем логическом, более удобном виде. Эта технология позволяет гибко распределять ресурсы между пользователями и эффективно ими управлять. В рамках виртуализации успешно реализуется удаленное копирование, моментальная копия, распределение запросов ввода-вывода на наиболее подходящие по характеру обслуживания накопители и множество других алгоритмов. Реализация алгоритмов виртуализации может осуществляться как средствами самого накопителя, так и с помощью внешних устройств виртуализации или же с помощью управляющих серверов, на которых работает специализированное программное обеспечение под стандартными ОС.

Это, конечно, очень малая часть того, что можно сказать о виртуализации. Эта тема очень интересна и обширна, поэтому мы решили посвятить ей отдельную публикацию.

Статью можно также прочитать в журнале «Сети&Бизнес» №2, 2003

Storage Class Memory / HDD, SSD, флешки, прочие носители информации / iXBT Live

За все время существования теории вычислительных машин и систем справедливым оставалось одно утверждение: процессоры гораздо более производительные и дорогие, чем устройства хранения данных. Тот факт, что CPU способен обслуживать множество запоминающих устройств разом, оказал значительное влияние на разработку аппаратного и программного обеспечения для систем самых разных размеров.

Действительно, в таких книгах, как «Вычислительные системы: взгляд программиста» («Computer Systems: A Programmer’s Perspective») Рандала Брайанта (Randal Bryant) и Дэвида О’Халларона (David O’Hallaron) делается упор на иерархию памяти и её влияние на разрабатываемые программы.

Однако дата-центрам и разработчикам ПО нужно готовиться к грядущим изменениям. Появление высокоскоростных энергонезависимых устройств хранения информации, обычно называемых аббревиатурой SCM (Storage Class Memories), пошатнет привычные устои. SCM постепенно набирают популярность, однако для работы с ними требуется выделять один или сразу несколько многоядерных процессоров, чтобы совладать с их производительностью (сотни тысяч IOPS).

Скорость работы долговременных хранилищ всегда была сильно ниже, чем скорость работы CPU, и эта разница только увеличилась за период с начала 90-х до начала 00-х годов. Процессоры стабильно улучшались и совершенствовались, а производительность механических дисков оставалась неизменной – развитию препятствовала физика. На протяжении десятилетий, чтобы сократить этот разрыв и избежать простоев процессора, придумывались различные схемы и методики.

Одним из способов является кэширование. В современных системах кэширование выполняется на всех системных уровнях: процессор кэширует RAM, операционные системы кэшируют целые дисковые секторы и так далее.

Другие способы позволяют в буквальном смысле разменять процессорное время на производительность. Например, сжатие и дедупликация уменьшают размеры обрабатываемых данных, и получается, что «быстрая» память как бы увеличивается в размерах, но за это приходится платить вычислительными ресурсами. Сжатие остается основной техникой, используемой в системах хранения корпоративного уровня, а также средах, работающих с большими данными. Такие инструменты, как Apache Parquet реорганизуют и сжимают данные на дисках, чтобы уменьшить время чтения.

От всех этих недостатков освобождены флеш-хранилища. Эта технология не нова, а SAS и SATA SSD можно приобрести уже лет десять как. Однако SCM переводит флеш-устройства на новый уровень: флеш-память подключается к PCIe-шине, вместо медленных шин SAS и SATA, что увеличивает скорость обмена данными.

Более того, зарождаются такие SCM, как например NVDIMM. NVDIMM производится в виде DIMM-модулей и, по сути, представляет собой гибридную память, объединяющую оперативную память DRAM и флеш-память NAND.

В обычных условиях модули NVDIMMвыполняют функцию обычной DRAM-памяти, но в случае сбоя или выключения системы данные из DRAMперемещаются в энергонезависимую флеш-память, где могут храниться неограниченно долго. Когда компьютер возобновляет работу, данные копируются обратно. Такой подход позволяет ускорить процесс запуска машины и снизить вероятность потери важных данных.

На сегодняшний день SCM с интерфейсом PCIe позволяют добиться увеличения производительности в 1000 раз (100k IOPS против 100 IOPS). К сожалению, это ведет к значительному увеличению в стоимости: SCM стоят в 25 раз дороже обычных HDD ($1,50/ГБ против $0,06/ГБ). Устройства корпоративного класса стоят от $3000 до $5000 каждое.

Чтобы максимизировать эффективность использования дорогих SCM, системы хранения должны постоянно обеспечивать их работой, то есть держать их занятыми. Получается, что мы не можем просто заменить магнитные диски – нам придется перерабатывать аппаратные системы и программное обеспечение.

К этому вопросу нужно подходить осторожно, поскольку слишком большое количество флеш-устройств приведет к значительным затратам денежных средств, а слишком малое их количество – к сложностям обращения к ним. Найти правильный баланс не так уж и просто.

Также стоит помнить и о временном разделении ресурсов. На протяжении многих лет для взаимодействия жесткого диска и процессора использовались прерывания. Для ядра, работающего на частотах, измеряемых гигагерцами, не составляет труда обслужить прерывание каждые несколько секунд. Одно ядро может управлять десятками или сотнями дисков, не рискуя «захлебнуться». Однако с появлением низколатентных устройств хранения этот подход больше неприменим.

Эта модель должна серьезно измениться. Серьезный прирост в производительности получили не только устройства хранения данных – ускорение работы сетевых устройств также имело место: сначала до 10G, потом до 40G, затем до 100G. Может удастся «подсмотреть» решение в этой сфере?

Однозначного ответа дать не получится, поскольку слишком велика разница в ускорении: сети стали быстрее в тысячу раз, а запоминающие устройства – в миллион. Более того, при работе с памятью часто приходится поддерживать сложные функции сжатия, кодирования и дедупликации, потому методики оптимизации, применяемые для работы с пакетами, скорее всего, не подойдут.

В сетях для снижения латентности применяется способ, когда всеми пакетами управляет приложение в обход ядра. Однако между сетями и устройствами хранения данных есть разница: сетевые потоки независимы и могут обрабатываться параллельно на нескольких ядрах, в случае ЗУ все запросы придется координировать.

Очевидно, что это непрактично. Один контроллер неспособен управлять доступом к огромному количеству SCM-устройств одновременно. Аппаратное обеспечение будет использоваться в пол силы, потому нужен иной подход.

Требования нагрузки к емкости и производительности не совпадают с аппаратными возможностями, что ведет к ограничениям в использовании высокоскоростных дисков. Например, данные объемом 10 ТБ с ожидаемой нагрузкой в 500k IOPS задействуют лишь половину возможностей дисков, если будут храниться на SCM-устройствах объемом в 1ТБ, способных обрабатывать до 100k IOPS каждый.

Однако нужно помнить о том, что большая часть данных не является «горячей», поэтому неэффективно хранить их все на высокоскоростных флеш-устройствах. Во многих случаях нагрузка согласуется с распределением Парето: 80% всех обращений адресовано 20% данных.

Гибридная система с различными уровнями хранилищ (с различными характеристиками производительности) является хорошим решением для смешения «холодных» и «горячих» данных, когда SCM-устройства выступают в качестве кэша для медленных дисков. Но нужно помнить, что шаблоны доступа со временем изменяются – надо своевременно на это реагировать и перемещать данные.

В грамотно построенных системах такой способ позволяет эффективно использовать аппаратное обеспечение без снижения производительности. Однако системы должны иметь гибкие политики, которые бы запрещали активным, но низкоприоритетным задачам вмешиваться в работу бизнес-критических приложений. Грамотная реализация и отладка этих механизмов – это совсем не тривиальная задача.

Так что же нас ждет в будущем?

Как было сказано выше, уже есть разработанные SCM-устройства. PCIe SSD – наиболее известный тип SCM и уже оказал значительное влияние на инфраструктуру дата-центров. Вторым примером может служить NVDIMM, которая имеет характеристики производительности, сравнимые с DRAM. Такие устройства уже доступны сегодня и продолжают развиваться.

SCM-технологиями занимается компания HP. Их проект под названием The Machine не что иное, как попытка разработать новую компьютерную архитектуру на мемристорах. Существование мемристора – четвёртого базового компонента электрических схем было предсказано в 1971 году Леоном Чуа (Leon O. Chua), однако лабораторный образец запоминающего элемента был создан только в 2008 году коллективом учёных во главе со Стэнли Уильямсом (Stanley Williams) в исследовательской лаборатории фирмы Hewlett-Packard.

Этот пассивный элемент способен запоминать собственное состояние. Можно сказать, что это резистор, сопротивление которого изменяется в зависимости от протекающего через него заряда. Когда элемент обесточивают, измененное сопротивление сохраняется.

В настоящее время ведутся разработки коммерческой реализации мемристора. Как только это произойдет, появится возможность для создания новых видов памяти, способных помимо хранения данных еще и обрабатывать их.

Что касается The Machine, то в ней нет границы между оперативной памятью и постоянным хранилищем данных. Вся память представляет собой оперативную. Это нивелирует проблемы, связанные с передачей информации между устройствами, работающими с разной скоростью.

Думается, что SCM-технологии призваны побороть неэффективность, возникающую при «общении» медленной и быстрой памяти. Тем интереснее наблюдать за происходящим: как новые разработки затронут все уровни инфраструктурного стека. Все еще только начинается.

Чтобы узнать экспертное мнение по данной теме, мы обратились за комментариями к российскому эксперту и привели мнение западных специалистов.

Комментирует руководитель отдела развития проекта 1cloud.ru Сергей Белкин:

«Разные типы дисков могут требоваться для решения различных задач. Использование дисков различных типов может быть оправданным при создании многоуровневых систем хранения данных – данные, которые часто используются приложениями, можно размещать на более быстрых дисках.
К примеру, если существует сервис, который активно работает с базой данных, то ее имеет смысл перенести на отдельный SSD-диск – это поможет оптимизировать скорость ее работы. При этом, саму операционную систему логично оставить на более медленных дисках. Одновременное использование различных типов дисков позволяет сделать общее инфраструктурное решение более гибким, эффективным и оптимизированным по цене.
Что касается новых разработок в сфере твердотельных накопителей, то в прошлом году компании Intel и Micron анонсировали 3D XPoint (произносится как «кросспойнт») – безтранзисторную трехмерную архитектуру и заявили, что срок эксплуатации и скорость работы таких ЗУ превысит возможности памяти NAND в 1000 раз. Если это решение станет коммерческим, то, я думаю, оно с большой долей вероятности будет использоваться в центрах обработки данных для хранения часто запрашиваемых «горячих» данных»

Мнение Джорджа Крампа (George Crump) из Storage Switzerland:

«SCM – это новый тип хранилища, которое может стать промежуточным звеном между высокопроизводительной DRAM и дешевыми HDD. SCM-память способна обеспечить скорость считывания, близкую к скорости чтения DRAM, и скорость записи, во много раз превышающую возможности жестких дисков.
Это стало возможным благодаря интерфейсу PCIe, через который флеш-хранилище подключается напрямую к процессору. Однако не любой SSD-накопитель, подключенный по PCIe, является SCM-устройством.
Некоторые поставщики в погоне за производительностью устанавливают несколько контроллеров на свои карты, каждый из которых отвечает за свою область флеш-памяти. На первый взгляд, это кажется здравой идеей, однако в этом случае у контроллера нет возможности записывать или читать блоки, которые находятся за пределами его компетенции.
Если блок большой – это, наоборот, может негативно повлиять на скорость работы. Эта и другие проблемы с производительностью, возникающие из-за неэффективности существующих интерфейсов, тормозят процесс адаптации технологии».

Мнение Скотта Дэвиса (Scott Davis), технического директора Infinio:

«SCM-технологии станут доступны для коммерческого использования не раньше конца 2016 года.
Скорее всего, это будет ранняя реализация технологии 3D XPoint от Intel. HP и SanDisk также анонсировали, что работают над совместным проектом, однако их продукт, вероятно, выйдет на рынок не раньше начала 2017 года.
Стоит учитывать, что, как в случае со многими новыми технологиями, SCM-устройства первое время будут обладать ограниченной областью применимости. Препятствием для выхода на широкий рынок станет стоимость устройств».

Устройства хранения информации: классификация, описание :: BusinessMan.ru

В основе функционирования любого типа компьютера лежит запоминающее устройство, способное сохранять информацию, использовать ее для расчетов и выдавать по первому требованию оператора.

Определение

Устройство хранения информации представляет собой приспособление, связанное с остальными элементами компьютера и способное воспринимать внешнее воздействие. В современных ЭВМ применяется сразу несколько типов подобных изделий, каждое из которых обладает собственной функциональностью и особенностями работы. Устройства хранения ключевой информации классифицируются по своим принципам работы, требованиям к энергообеспечению и по многим другим параметрам.

Действия с памятью

Главная задача любого записывающего приспособления заключается в возможностях работы с ним оператора. Все действия разделяются на три типа:

Хранение. Вся информация, попавшая на записывающее устройство, обязана находиться там до удаления оператором или компьютером. Бывают изделия, способные хранить данные долгое время даже при выключенной ЭВМ. Именно так функционируют стандартные жесткие диски. Другие схожие изделия (оперативная память) содержат только часть данных, чтобы оператор получил к ним доступ максимально быстро.
Ввод. Информация должна каким-то образом попадать на записывающее устройство. В данном случае разделение может идти по этому принципу. Одни модели работают напрямую с оператором. Другие связаны с иными запоминающими элементами, ускоряя их работу.
Вывод. Полученные данные выводятся на интерфейс взаимодействия с пользователем или предоставляются для расчетов другим запоминающим приспособлениям.

Все устройства хранения, ввода и вывода информации тем или иным образом связаны в единую сеть в рамках одного компьютера. Все вместе они обеспечивают его работоспособность.

Форма

Классификация устройств хранения информации по форме записи разделяет их все на две категории: аналоговые и цифровые. Первые в современном мире практически не используются. Ближайшим примером аналогового записывающего устройство является кассета для магнитофона, которая уже давно устарела. Тем не менее некоторые разработки ведутся и в этом направлении. На данный момент уже есть несколько прототипов неплохих по емкости и скорости работы изделий такого типа, однако сравнительно с цифровыми устройствами они значительно проигрывают по стоимости производства. Стандартный жесткий диск для компьютера хранит информацию в виде единиц и нулей. Это цифровое записывающее устройство, как и подавляющее большинство современных изделий такого типа. В основе их функционирования лежит принцип сохранения физического состояния носителя в одной из двух возможных форм (для двоичной системы). Сейчас применяются и более современные варианты, способные использовать троичный или даже десятичный вид записи. Это стало возможно благодаря использованию уникальных свойств разных материалов и появлению новых технологий записи данных на накопители. Человечество постепенно увеличивает объем возможной для сохранения информации с одновременным уменьшеним размера носителя.

Устойчивость записи

Классификация по этому показателю разделяет все устройства хранения и обработки информации на четыре группы:

Оперативные записывающие (ОЗУ). Оператор получает возможность вносить новую информацию, считывать уже имеющуюся и работать с ней прямо в процессе функционирования. Пример – оперативная память компьютера. В ней хранится большая часть постоянно запрашиваемых данных, благодаря чему не требуется постоянно обращаться к основному жесткому диску. В большинстве случаев вся информация стирается с таких носителей после отключения подачи энергии.
Перезаписываемые (ПППЗУ). Такие изделия позволяют записывать, стирать и вновь вносить данные практически неограниченное количество раз. Пример – CD-RW и стандартные жесткие диски. В любом компьютере такой памяти больше всего, и именно на ней хранится практически вся информация пользователя.
Записываемые (ППЗУ). На таких устройствах данные можно сохранить только один раз. Невозможно перезаписать или удалить информацию, что и является самым главным минусом подобных изделий. Пример – диски CD-R. В современном мире используется крайне редко.
Постоянные (ПЗУ). Этот тип устройств сохраняет единожды записанную информацию и не позволяет как-либо ее удалять или изменять. Пример – BIOS компьютера. В нем все данные остаются без изменений и пользовать получает возможность выбрать только другие настройки из перечня существующих. В отличие от ППЗУ, на такие носители все же можно вносить новые данные, но, как правило, это требует полного удаления старых. То есть BIOS можно переустановить, но не дополнить или обновить.

Энергонезависимость

Для работы компьютеру требуется электроэнергия, без которой выполнение всех действий было бы невозможным. Однако если бы каждый раз после выключения ПК данные обо всей проделанной работе стирались, то значение ЭВМ в нашей жизни было бы значительно меньшим. Так какие устройства хранения информации по потребности в питании существуют?

Энергозависимые. Эти изделия работают только тогда, когда есть к ним подано электричество. К такому типу относят стандартные модули оперативной памяти DRAM или SRAM.
Энергонезависимые. Для сохранения информации записывающие устройства не требуют питания. Пример – жесткий диск компьютера.

Тип доступа

Устройства хранения информации разделяются также и по этому показателю. По типу доступа память бывает:

Ассоциативной. Используется редко. К таким изделиям можно отнести специальные устройства, которые используются с целью повышения скорости работы обширных массивов данных.
Прямой. Полный и неограниченный доступ предлагается жесткими дисками, которые относятся к этому типу доступа.
Последовательной. Сейчас практически не используется. Ранее применялся в магнитных лентах.
Произвольной. По такому принципу работает оперативная память, предоставляющая пользователю возможность в произвольной форме получить доступ к последней информации, с которой работала система. Применяется для ускорения работы компьютера.

Исполнение

Устройства, предназначенные для хранения информации, имеют классификацию по типу исполнения.

Печатные платы. К такому виду относятся модули оперативной памяти и картриджи для старых приставок. Работают очень быстро, однако нуждаются в постоянной подаче энергии, из-за чего их текущее применение носит вспомогательную роль.
Дисковые. Бывают магнитными и оптическими. Самым популярным представителем считается жесткий диск компьютера. Используются в качестве основного носителя информации.
Карточные. Вариантов исполнения много. Из последних можно отметить флеш-карты. Ранее этот тип применялся для изготовления перфокарт и их магнитных аналогов.
Барабанные. Пример – магнитный барабан. Практически не используется.
Ленточные. Пример – перфорированные или магнитные ленты. В современном мире почти не встречается.

Физический принцип

По физическому принципу работы устройства ввода, вывода, хранения и обработки информации разделяются на:

Магнитные. Выполняются в виде сердечников, дисков, лент или карт. Пример – жесткий диск. Это не самый быстрый способ обработки информации, однако он позволяет долгое время хранить данные без подачи энергии, что и обеспечивает их текущую популярность.
Перфорационные. Изготавливаются как ленты или карты. Пример – старинная перфокарта, используемая для записи информации в первых моделях ЭВМ. Из-за сложности изготовления и небольшого количества хранимых данных сейчас такой принцип практически не используется.
Оптические. CD-диски любого вида. Все они работают на принципе отражения света от своей поверхности. Лазер прожигает дорожки, образуя участки, отличающиеся от общей массы, что позволяет использовать все ту же систему двоичного кода, в которой одно состояние диска обозначается единицей, а другое – нулем.
Магнитооптические. Диски типа MO. Используются редко, но сочетают в себе преимущества обеих систем.
Электростатические. Работают по принципу накопления заряда электричества. Примеры – ЭЛТ, конденсаторные запоминающие устройства.
Полупроводниковые. Используют особенности одноименных материалов для сбора и хранения данных. Так работает флеш-накопитель.

Помимо всего прочего, существуют запоминающие устройства, работающие по другим физическим принципам. Например, на сверхпроводимости или звуке.

Количество состояний

Последним вариантом классификации устройства долговременного хранения информации является то, сколько состояний оно может поддерживать. Как уже было сказано выше, цифровые носители работают за счет изменения своей физической части на основе поданной электроэнергии. Самый простой пример: если магнитится, значит, это равно цифре 1, если нет, значит – 0. Это принцип работа двоичных систем, которые способны поддерживать только два варианта состояния. Сейчас также используются устройства, работающие в трех и более формах. Это открывает очень широкие перспективы использования носителей данных, позволяет уменьшать их размер, одновременно с увеличением общего объема хранимой информации.

Итоги

Старые накопители были очень большими. Самые первые компьютеры требовали помещения, сравнимого с современными спортивными залами, да еще при этом работали очень медленно. Прогресс не стоит на месте и сейчас устройства хранения информации, даже самые объемные, можно просто положить в карман. Дальнейшее развитие может пойти как по пути поиска новых материалов или способов взаимодействия со старыми, так и по направлению создания постоянной и стабильной связи по всему миру. В таком случае емкие накопители будут расположены в специальных серверных, а все данные пользователь будет получать по «облачной» технологии.

Blog