четверг, 8 марта 2012 г.

Сравнение GPFS и HDFS

Сравнительная таблица основных характеристик General Parallel File System (GPFS) и Hadoop Distributed  File System (HDFS):

GPFS
HDFS
блоки меньшего размера
64 Мб/блок
есть поддержка и SAN, и RAID
Commodity hardware – нет поддержки SAN или RAID
масштабируемость 1000 узлов
масштабируемость 1000 узлов
поддержка POSIX, т.е. поддержка MS SQL, Oracle DB, DB2.
---
чуть более производительное решение согласно тестам

метаданные распределены по всему кластеру
метаданные хранятся на узлах – наличие единой точки отказа системы
поддержка параллельной записи (concurrent write)
нет поддержки параллельной записи









Вывод:
В итоге, несмотря на некоторые явные преимущества GPFS с точки зрения отсутствия единой точки отказа и поддержки многих промышленных СУБД, нельзя с полной уверенностью утверждать, что данное решение лучше. Причина, как обычно, одна – позиционирование решения: разработкой занимается программист в небольшой фирме и главная задача перед ним – просто попробовать и им движет больше интерес, чем необходимость сделать решение, то HDFS – предпочтительнее. В данном случае также минимизируется фактор поддержки POSIX-стандарта, ведь может быть использована nosql СУБД.  GPFS – решение уровня предприятия, когда разработкой и внедрением занимается не один десяток человек и предполагается использование в нескольких филиалах по всей стране. В этом случае такие преимущества GPFS, как бОльшая производительность, отсутствие единой точки отказа и поддержка POSIX играют решающую роль. 

Полезные ссылки:

Комментариев нет:

Отправить комментарий