Вернуться на главную страницу Algo.ru  
 

Сохранить чтобы приумножить

 

 

     

Храните информацию грамотно...

31 августа 2001
–> вернуться на System Integration (reviews)

Практически с момента появления вычислительной техники одной из основных сфер ее применения стало хранение информации. Что такое хранилища данных и какими они бывают, систему какого производителя и для каких целей надо приобретать, наконец, как понять, почему система хранения данных необходима для эффективного ведения бизнеса?

Существуют, по меньшей мере, три причины, стимулирующие развитие систем хранения данных. Прежде всего это экспоненциальный рост объемов информации, которые удваиваются каждый год. Несильно отстает от роста объема хранимых данных и количество пользователей, которым эти данные необходимы в их повседневной работе. Третья причина — рост производительности самих вычислительных систем, в первую очередь серверов. Наращивание мощности «железа» может не быть напрямую связано с системами хранения информации, чаще серверные мощности наращивают для того, чтобы повысить производительность каких-то конкретных прикладных подсистем. Однако именно эти подсистемы, занимающиеся обработкой информации, предъявляют качественно новые требования к системам хранения данных. То есть система хранения не имеет права отставать от растущих потребностей.

Как хранить

Основных принципов построения систем хранения информации относительно немного. В первую очередь, это Direct Attached Storage — системы хранения, которые подключены напрямую к серверу посредством SCSI-шин или, возможно, других интерфейсов. Последние, обычно, специфичны для каких-то конкретных производителей. Например, у IBM есть интерфейс ESCON для подключения хранилищ данных к мейнфреймам, свои интерфейсы были у Digital, и есть у Sun. Технология Direct Attached Storage достаточно дешева и закрывает задачу организации дискового массива для каких-то отдельных подсистем. Соответственно, у нее есть свои ограничения, которые заложены в стандарты. Например, ограничения SCSI-стандарта просто не позволяют развивать систему хранения выше некоторого определенного уровня. А значит, возможностей этого стандарта порой становится недостаточно для того, чтобы обеспечить требуемый объем хранимой информации и централизованный доступ к ней. Кроме того, с увеличением объема информации встает задача администрирования. Но для того, чтобы сделать администрирование максимально простым, а структуру системы — прозрачной, необходимо строить централизованную систему. В то же время существующие стандарты (тот же самый SCSI) имеют существенные ограничения по нагрузке (по количеству подключенных на SCSI-шину серверов), по длине внешних кабельных соединений, по скорости, на которой могут одновременно работать все участники.

Решает эти проблемы способ, называемый «сетевым хранением» (Network Attached Storage или NAS). Суть его заключается в том, что подключение к системе хранения информации уже строится не по типу «общая шина», а по типу коммутируемых сетей. В NAS есть централизованные файл-серверы, на которых хранится информация (причем локально система хранения может подключаться тем же самым Direct Attached Storage), а все остальные подсистемы пользуются сервисами хранения этого файл-сервера, используя вычислительные сети LAN или WAN. То есть доступ организуется посредством локальных или глобальных сетей.

Здесь наблюдается некоторая аналогия с построением локальных или корпоративных вычислительных сетей, в которых используются коммутаторы и маршрутизаторы, обеспечивающие подключение пользователей по схеме «звезда». Таким образом, во-первых, удается гарантировать пропускную способность для каждого участника, подключенного к данной шине, и, во-вторых, обойти ограничения по расстоянию и по количеству участников, которые могут одновременно работать с системой хранения. Кстати сказать, именно необходимость этой централизации систем хранения информации сыграла значительную роль в развитии современных хранилищ данных. А инструментом, позволившим реализовать возникшую задачу, стал протокол Fiber Channel: в него оказалась заложена вся та требуемая функциональность.

Использование оптики позволяет преодолеть ограничение SCSI по расстоянию, а использование центральных коммутаторов — во-первых, обойти ограничения на гарантированную пропускную способность, во-вторых, — на количество участников. Кроме того, одновременно с преодолением ограничений существующих стандартов обеспечивается новая функциональность построения на базе данного протокола и на базе сетей хранения данных отказоустойчивых и катастрофоустойчивых решений. Дело в том, что увеличение расстояния, независимость от количества подключенных участников и независимость от места расположения позволяют разносить элементы систем на большие (свыше 100 км) расстояния. Именно такое «дистанцирование» и обеспечивает катастрофоустойчивость решений.


12345

Концепция хранилищ данных

Под термином «хранилище данных» подразумевается некоторая аппаратная инфраструктура, которая обеспечивает централизованную систему хранения, т. е. систему хранения, к которой подключается множество хост-систем, гибким образом получающих требуемый объем информации при гарантированной производительности данного объема информации.

Способов построения сетей хранения данных (SAN) на самом деле достаточно много — все базируется на использовании протокола Fiber Channel, оптических коммутаторов или концентраторов и оптических кабелей. На самом деле структура может быть совершенно разнообразной: как древовидной, так и устроенной по типу «звезда» или mash (матрица, «все ко всем»). Каждая такая структура (реализация) базируется на том, что именно она действительно нужна организации. При этом Fiber Channel не накладывает никаких ограничений на реализованные системы, — он предоставляет множество способов, и этого количества вполне достаточно для того, чтобы построить систему с требуемой структурой.



Для кого хранить

Между тем никакой стандарт не возник бы и никакие новые аппаратные решения не появились бы, если бы хранилища данных не были востребованы на рынке. О востребованности систем хранения данных говорит тот факт, что соответствующий сегмент рынка увеличивается, чуть ли не удваивается-утраивается, каждый год. Рынок не нов, здесь есть свои фавориты. Другая особенность этого рынка в том, что он достаточно четко структурирован. Основные игроки — это EMC, Hitachi, Hewlett-Packard, IBM, Compaq. Некоторые производители под своей торговой маркой предлагают решения других фирм, но при этом все равно используются решения названных лидеров.

Чтобы понять, чем одно решение отличается от другого, надо, сперва, вывести критерии, по которым оцениваются системы хранения. Критерии же эти таковы:

  • максимальный объем хранимой информации;
  • производительность данной подсистемы, измеренная в количестве операций в секунду;
  • нагрузочная способность (максимальное количество систем, которые можно подключить к хранилищу данных на гарантированной скорости);
  • стоимость хранения единицы информации.

Оговоримся, что последний по порядку показатель — важнейший с экономической точки зрения.

Как и в других сегментах рынка информационных систем, есть системы с хорошей ценой, но при этом с ограниченными возможностями, есть системы с неограниченными возможностями, но при этом за соответствующую цену. Эту разницу надо чувствовать для того, чтобы, во-первых, оценить, что же нужно в каждом конкретном случае для организации. Переплачивать деньги за то, что никогда не будет использоваться, — бессмысленно. Безусловно, решения лидеров рынка функциональны, но за любую функциональность надо платить. А это имеет смысл делать лишь в том случае, если функциональность не просто нужна, а необходима заказчику.

Наибольшей функциональностью обладают системы Hitachi (Hewlett-Packard продает системы хранения Hitachi под своей торговой маркой, а недавно о глобальном партнерстве в области систем хранения данных объявили Sun, Hitachi и Hitachi Data Systems) и EMC. На данный момент эти системы обладают максимальным объемом, который можно «засунуть внутрь», максимальной нагрузочной способностью при соблюдении всех правил построения отказоустойчивых и катастрофоустойчивых решений, причем независимо от операционной системы. Однако функциональность, которую они предоставляют, характерна для корпоративных систем высшего уровня, а отсюда их чрезвычайно высокая стоимость, которую готовы преодолеть далеко не все.

Что касается решений Compaq, то они очень близки по максимальным характеристикам к этим системам, в некоторых из них уступают, но при этом обеспечивают максимально выгодный показатель цены за единицу хранения информации. То есть при параметрах, близких к системам лидеров, они имеют весьма привлекательную цену. А ведь именно соотношение цена/качество часто является определяющим для заказчиков. Кроме того, отличительная особенность решений на базе Compaq в том, что на их основе можно строить гибкие, наращиваемые и мощные системы, которые будут доступными и приемлемыми для заказчика.

Существуют и более скромные решения (типа Dell). Они характеризуются низкой стоимостью, но функциональность при этом у них ограничена уже существенно. Дело здесь в том, что эти системы находятся посередине между Direct Attached Storage и сетями хранения информации (SAN). То есть они уже отошли от Direct Attached Storage, избавились от ограничений, которые характерны для SCSI и медных кабелей, но полноценных сетей хранения данных эти решения создавать еще не позволяют, а находятся в процессе.

Впрочем, как показывает практика, создавать и развивать SAN-системы могут позволить себе только немногие — EMC, Hitachi (Hewlett-Packard), Compaq.

Следующая особенность рынка хранилищ данных заключается в том, что производители сейчас ориентируются не на предоставление «железа» с некоторыми заявленными параметрами, а на построение конкретных решений — катастрофоустойчивых, отказоустойчивых сетей хранения данных, которые востребованы. Сегодня компания, выпустив диск с интерфейсом Fiber Channel, может сказать, что он свободен от ограничений, свойственных SCSI. Но сам по себе он остается просто жестким диском. И на базе даже большого количества таких дисков трудно построить серьезную систему хранения. Вот и получается, что самое важное в хранилищах данных — это тщательно проработанная инфраструктура сети хранения данных.

Сама же дисковая подсистема (безусловно, важный компонент) занимает лишь вторую позицию в «рейтинге». Дисковая подсистема является внешней по отношению к основным системам и содержит в себе нужное количество RAID-контроллеров (они обеспечивают требуемый уровень производительности, включая балансировку нагрузки, надежности и отказоустойчивости) и жестких дисков. Сейчас максимальный объем одного диска — 72 Гбайт, всей подсистемы — порядка 10 Тбайт. Чтобы все это работало как единый механизм, необходим достаточно большой объем кэш-памяти, а управлять всей этой структурой должна мощная вычислительная система, которая помимо высокой производительности обеспечивала бы целостность данных, балансировку нагрузки, «откаты» в случае возникновения каких-то нештатных ситуаций или сбоев и полную прозрачность функционирования системы для хостов.

Отдадим должное производителям, здесь они все идут практически вровень — предлагаемые решения в области инфраструктуры самой сети подключения и структуры построения системы хранения у всех практически одинаковы. Есть уровень, обеспечивающий подключение к серверам, есть уровень, обеспечивающий обработку информации, и есть уровень, обеспечивающий хранение, т. е. работу непосредственно с жесткими дисками. Все эти системы выдержаны в соответствии с общими (классическими) канонами построения таких систем.

Именно поэтому, выбирая конкретную реализацию конкретной системы, надо очень четко представлять, какую систему мы строим и зачем. А создавая катастрофоустойчивую систему, надо быть готовым к тому, что стоимость единицы хранения будет как минимум в два раза больше, чем в обычной отказоустойчивой системе.


12345 Виртуальные хранилища данных

Недавно Compaq обнародовала трехлетний план разработки систем хранения данных, охватывающий множество секторов этого рынка и предусматривающий выпуск продуктов для преобразования NAS – SAN, недорогих RAID-массивов и мощных усовершенствованных виртуализированных RAID-систем. А выпустить на рынок программного обеспечения виртуализации ПО Compaq Versastor фирма пообещала уже в первом полугодии будущего года. Все эти планы наряду с обещанием выпустить в 2004 году усовершенствованную технологию сетевого управления Compaq называет ENSA-2 — второй очередью своей Enterprise Storage Networking Architecture.

Программа виртуализации систем хранения данных разделена на четыре этапа, средней протяженностью один год каждый. Первый этап плана Compaq, направленного на создание сетевых хранилищ данных на базе IP, завершится в нынешнем году. Компания намерена аттестовать свои продукты на совместимость с продуктами шести производителей сетевых решений и решений хранения данных для городских и глобальных сетей.

Завершение второго этапа IP-стратегии Compaq намечено на 2002 год. Он охватит протоколы FCIP, IFCP и iSCSI. На втором этапе планируется создание ряда проложенных в метро городских магистралей протяженностью около 300 км (в некоторых городах возможны даже кольцевые маршруты), в которых реализуются функции, более сложные, чем простая репликация, которые позволят составлять географически разрозненные системы SAN в единую логическую сеть.

Третий этап сетевой стратегии, планируемый на 2003 год, предусматривает предоставление заказчикам возможности объединять сети Fibre Channel и IP-сети. И на последнем, четвертом этапе в 2004 году Compaq перейдет к объединению SAN городского масштаба в общекорпоративные интрасети.

(Полный текст материала можно прочитать здесь .)



Что нужно в России

Несмотря на то, что средства, которые крупные российские компании готовы выделить на построение современной системы хранения информации, в среднем меньше, чем затрачиваемые на реализацию таких же задач на Западе, прогресс в этой области на лицо. Крупные российские фирмы находятся в процессе непрерывного развития, да и государственные учреждения в связи с оптимизацией управленческих функций сейчас больше внимания уделяют информационным технологиям. Очень показательна ситуация в банковской сфере, где объем документооборота, увеличение объема транзакций, обрабатываемых банком, централизация множества существующих подсистем диктуют необходимость построения сетей хранения данных и консолидации всей информации. Схожая ситуация на нефтегазовом рынке и у российских представительств крупных зарубежных компаний. То есть вопрос создания отказоустойчивых систем хранения данных весьма актуален. А следующим шагом будет обеспечение катастрофоустойчивости.

Сейчас, проводя анализ рынка, крупные российские компании приходят к выводу, что оптимальным вариантом для реализации их новых систем хранения является система хранения по принципу SAN.

Безусловно, такое решение IT-отдел крупной фирмы принимает не сам по себе, его консультантом обычно выступает системный интегратор. Наш корреспондент обратился за разъяснением к одному из таких интеграторов-консультантов — в компанию КРОК. Выбор пал на эту фирму потому, что именно эта компания является лучшим системным интегратором Compaq в России, что ежегодно подтверждается этой международной корпорацией. КРОК держит руку на пульсе всех новых решений и технологий, которые объявляет этот производитель. Построением систем хранения данных КРОК занимается с того самого момента, как Compaq официально объявила о том, что является игроком на рынке подобных систем, то есть как минимум уже три года. Все начиналось с систем хранения Fiber Channel для серверов Windows NT и потом — для кросс-платформенных решений Compaq StorageWorks EMA 12000/16000. Соответственно, компания-игрок обеспечивает полный цикл — от разработки технического задания, предоставления технического проекта, проработки детальной спецификации, до поставки и запуска такого решения, включая монтаж и настройку.

Выгодное отличие Compaq от других производителей в том, что у него все решения модульные. Эти модули можно использовать как отдельно (независимо), так и в составе какой-то централизованной системы хранения. Задача системного интегратора — обеспечить работоспособность данного решения. КРОК берет на себя ответственность за предлагаемые решения от момента его создания до момента его внедрения и эксплуатации. И оборудование Compaq позволяет достаточно гибко приспосабливать хранилища данных под требования заказчика. Ведь не все заказчики могут позволить себе купить систему на 10 Тбайт, но у очень многих из них уже встали вопросы отказоустойчивости, катастрофоустойчивости решений и построения централизованных систем, когда информация консолидирована в одном месте, к которому имеют доступ множество серверов и информационных подсистем. И в этом случае оборудование Compaq позволяет достаточно гибко балансировать в предлагаемых решениях между функциональностью, удовлетворяющей потребности заказчика, и стоимостью.

Что же касается реализации этих потребностей в готовом решении, то надо отметить, что типовые решения для таких целей подходят относительно редко. Чаще приходится создавать систему «на заказ». Вариантов тут два: либо модернизировать типовое решение, так, чтобы оно полностью удовлетворяло требованию заказчика, либо сразу строить решение, которое будет полностью «заточено» под какую-то систему клиента. КРОК придерживается тех способов, которые необходимы в каждом конкретном случае, у компании нет консервативного подхода для построения столь сложных систем. Всегда главным здесь является не функциональность «железки», которая предлагается, а именно та задача, под которую планируется построение той или иной централизованной системы хранения.


12345

Централизованные системы хранения ориентированы на определенную категорию заказчиков — на тех клиентов, которые в объемах хранимой информации и потребности в этой информации действительно вышли на тот уровень, который не позволяет уже использовать классические способы организации систем хранения, такие как Direct Attached Storage. Это те организации, которые стоят на этапе консолидации всей накопленной информации, обрабатываемой в компании. Консолидации, необходимой для того, чтобы обеспечить оперативную обработку и анализ данных. В принципе эти задачи можно решить некими «кустарными» средствами, но если уж принимается решение делать это без применения систем хранения информации, тогда руководству фирмы нужно быть готовым содержать достаточно сильную IT-службу, которая занималась бы обеспечением функционирования всей этой децентрализованной системы.




–> вернуться на канал System Integration (reviews)