Сравнительная таблица основных характеристик General Parallel File System (GPFS) и Hadoop Distributed File System (HDFS):
GPFS | HDFS |
блоки меньшего размера | 64 Мб/блок |
есть поддержка и SAN, и RAID | Commodity hardware – нет поддержки SAN или RAID |
масштабируемость 1000 узлов | масштабируемость 1000 узлов |
поддержка POSIX, т.е. поддержка MS SQL, Oracle DB, DB2. | --- |
чуть более производительное решение согласно тестам | |
метаданные распределены по всему кластеру | метаданные хранятся на узлах – наличие единой точки отказа системы |
поддержка параллельной записи (concurrent write) | нет поддержки параллельной записи |
Вывод:
В итоге, несмотря на некоторые явные преимущества GPFS с точки зрения отсутствия единой точки отказа и поддержки многих промышленных СУБД, нельзя с полной уверенностью утверждать, что данное решение лучше. Причина, как обычно, одна – позиционирование решения: разработкой занимается программист в небольшой фирме и главная задача перед ним – просто попробовать и им движет больше интерес, чем необходимость сделать решение, то HDFS – предпочтительнее. В данном случае также минимизируется фактор поддержки POSIX-стандарта, ведь может быть использована nosql СУБД. GPFS – решение уровня предприятия, когда разработкой и внедрением занимается не один десяток человек и предполагается использование в нескольких филиалах по всей стране. В этом случае такие преимущества GPFS, как бОльшая производительность, отсутствие единой точки отказа и поддержка POSIX играют решающую роль.
Полезные ссылки:
Комментариев нет:
Отправить комментарий