Скальлінг
ERDDAP™- Важкі навантаження, Сітки, кластери, федерації та хмарні обчислення
ERDDAP:
ERDDAP™є веб-додатком та веб-службою, яка об'єднує наукові дані з різних локальних та віддалених джерел і пропонує простий, послідовний спосіб завантаження підсетів даних у спільних форматах файлів і робить графіки та карти. Ця сторінка обговорює питання, пов'язані з важкоюERDDAP™Використання навантажень та вивчення можливостей для боротьби з надзвичайно важкими навантаженнями через сітки, кластери, федерації та хмарні обчислення.
У червні 2009 року було написано оригінальну версію. Немає суттєвих змін. Останнє оновлення 2019-04-15.
ЗАМОВИТИ
Зміс т цієї веб-сторінки Боб Симони особисті думки і не обов'язково відображають будь-яку позицію Уряду або урядуNational Oceanic and Atmospheric Administrationй Розрахунок спрощені, але я думаю, висновки правильні. Чи можу я використовувати несправну логіку або зробити помилку в моїх обчисленнях? Якщо так, несправність шахти самостійно. Будь ласка, надсилайте електронну пошту з виправленнямerd dot data at noaa dot govй
Важкі навантаження / обмеження
При важкому використанні автономнийERDDAP™буде протипоказано (від більшості, ймовірно,) від:
Дистанційне джерело смуга
- Дистанційна пропускна здатність джерела даних — Навіть з ефективним підключенням (наприклад, черезOPeNDAP) , якщо джерело даних віддалених даних має дуже високу пропускну здатність підключення до І нтернету,ERDDAP«Відповіді будуть обмежені як швидкоERDDAP™може отримувати дані з джерела даних. Рішення для копіювання данихERDDAP's жорсткий диск, можливо, зEDDGridПартнерствоабоEDDTableКопій
ERDDAPСтатус на сервери
- НемовляERDDAP's server має дуже високу пропускну здатність підключення до Інтернету,ERDDAP«Відповіді будуть обмежені як швидкоERDDAP™може отримати дані з джерел даних і як швидкоERDDAP™може повернути дані клієнтам. Єдине рішення для швидкого підключення до Інтернету.
Навігація
- Якщо є багато одночасних запитів,ERDDAP™може випускати пам'ять і тимчасово відмовитися від нових запитів. (ERDDAP™має декілька механізмів, щоб уникнути цього і мінімізувати наслідки, якщо це відбувається.) Так чим більше пам'яті в сервері краще. На 32-розрядному сервері 4+ ГБ дуже хороший, 2 ГБ океї, менше не рекомендується. На 64-розрядному сервері ви можете практично повністю уникнути проблеми, отримавши багато пам'яті. Дивитися\-Xmx і -Xms налаштуваннядляERDDAP/Томкат. АнжелаERDDAP™отримувати важке використання на комп'ютері з 64-розрядним сервером з 8 Гб пам'яті і -Xmx встановлюється до 4000М рідко, якщо коли-небудь, обмежений пам'яті.
Had Drive Bandwidth
- Доступ до даних, що зберігаються на жорсткому диску сервера, значно швидше, ніж доступ до віддалених даних. Навіть так, якщоERDDAP™Сервер має дуже високу пропускну здатність Інтернет-з'єднання, це можливо, що доступ до даних на жорсткому диску буде пляшка. Для більш швидкого використання (Наприклад, 10 000 р.) магнітні жорсткі диски або SSD диски (якщо це має значення) й Ще одним рішенням є зберігання різних даних на різних дисках, так що кумулятивна тверда пропускна здатність диска значно вище.
Too Багато Files Cached
- Занадто багато файлів впердятКаталог —ERDDAP™кешує всі зображення, але тільки кешує дані для певних типів запитів даних. Доступно для каталогу кеш-пам'яті для запису даних, щоб мати велику кількість файлів тимчасово. Якщо файл знаходиться в кеші (Дуже дякую!) й<пердят Мінуси і гт; вНалаштування.xmlДозволяє встановити, як довго файл може бути в кеші, перш ніж він видаляється. Налаштування меншого числа дозволить мінімізувати цю проблему.
Процесор
- Тільки два речі займають багато часу процесора:
- NetCDF4 іHDF5 тепер підтримує внутрішню компресію даних. Декомпресування великого компресуNetCDF4 / 4 / 4 / 4 / 4 / 4 / 5 / 6 / 6 / 4 / 5 / 6 / 6 / 4 / 5 / 6 / 4 / 5 / 6 / 6 / 6 / 5 / 6 / 6 / 6 / 5 / 6 / 6 / 6 / 5 / 6 / 5 / 6 / 6 / 6 / 6 / 6 / 5 / 6 / 6 / 5 / 6 / 6 / 5 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 4 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 4 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 / 6 /HDF5 файлів даних можна приймати 10 або більше секунд. (Це не несправність виконання. Це природа стиснення.) Таким чином, багаторазові одночасні запити на дані з даними, що зберігаються в стиснених файлах, можуть покласти на будь-який сервер. Якщо це проблема, то рішення для зберігання популярних даних в некомпресованих файлах або отримання сервера з процесором з більшою кількістю ядер.
- Виготовлення графіків (включаючи карти) : грубо 0.2 - 1 другий за графік. Отже, якщо було багато одночасних унікальних запитів для графіків (WMSКлієнти часто роблять 6 одночасних запитів!) , може бути обмеженням процесора. Коли багато користувачів працюютьWMSКлієнти, це стає проблемою.
Кілька ідентичнихERDDAPs з балансуванням навантаження?
Питання часто приходить: "Щоб боротися з важкими навантаженнями, я можу встановити кілька ідентичнихERDDAPз балансуванням навантаження? Це цікаве питання, оскільки воно швидко потрапляє в ядроERDDAP- дизайн. Швидка відповідь «не». Я знаю, що це розчарування відповідь, але є пара прямих причин і деякі більші фундаментальні причини, чому я розробленийERDDAP™використовувати інший підхід (федераціяERDDAPs, описаний в об'ємі цього документа) , що я вірю краще рішення.
Деякі прямі причини, чому ви не можете / ви не встановлюєте кілька ідентичнихERDDAPй
- НаданіERDDAP™читати кожен файл даних, коли він першим стає доступним для пошуку діапазонів даних у файлі. Потім зберігає інформацію в файлі індексу. Пізніше, коли запит користувача на дані надходить,ERDDAP™Використовуйте цей індекс, щоб дізнатися, які файли для перегляду на запитані дані. Якщо було кілька ідентичнихERDDAPs, вони будуть робити цей індекс, який було завдано зусиль. З федеративною системою описано нижче, індексація проводиться тільки один раз, по одному зERDDAPй
- Для деяких типів запитів користувачів (Наприклад, для.nc.png, .pdf файли) ERDDAP™має зробити весь файл перед відправкою. Про насERDDAP™кешує ці файли на короткий час. У разі ідентичного запиту (як це часто робить, особливо для зображень, де URL вбудований в веб-сторінку) йERDDAP™може повторно використовувати файл кешування. У системі багаторазового ідентичногоERDDAPs, ці кешовані файли не діляться, тому коженERDDAP™не потрібно відтворити.nc, .png, або .pdf файли. З федеративною системою описано нижче, файли тільки зроблені один раз, по одному зERDDAPs, і reused.
- ERDDAP's система підписки не встановлюється, щоб бути розділений декількомаERDDAPй Наприклад, якщо балансувальник вантажу надсилає користувача одномуERDDAP™і користувач підписує на дані, а потім іншіERDDAPне знає про це підписку. Після цього, якщо балансувальник навантаження направляє користувачеві різнимERDDAP™і запитує список підписок, іншихERDDAP™не скажуть, (провідний його / він, щоб зробити дублікатську підписку на інші EREDDAP) й З федеративною системою описано нижче, система підписки просто ручається основною, громадською, композитноюERDDAPй
Так, для кожного з тих проблем я міг (з великим зусиллям) інженер рішення (поділитися інформацією міжERDDAPй) , але я думаю,федераціяERDDAPs підхід (описано в об'ємі цього документа) є набагато краще загальний розчин, частково тому що він працює з іншими проблемами, які багаторазово ідентичніERDDAPs-with-a-load-balancer підхід навіть не запускається до адреси, зокрема, децентралізованої природи джерел даних у світі.
Це найкраще прийняти простий факт, що я не дизайнERDDAP™бути розгорнутий як багаторазовий ідентичнийERDDAPs з балансером навантаження. Я свідомо спроектованийERDDAP™добре працювати в межах федераціїERDDAPs, які я вірю має безліч переваг. Ймовірно, федераціяERDDAPs відмінно вирівняється з децентралізованою, розподіленою системою дата-центрів, які ми маємо в реальному світі (Подумайте про різні регіони IOOS, або різні регіони CoastWatch, або різні частини NCEI, або 100 інших центрів обробки данихNOAA, або різні НАСА ДААК, або 1000 центрів даних по всьому світу) й Замість того, щоб розповісти всі дата-центри світу, які вони повинні відмовитися від своїх зусиль і поставити всі свої дані в централізованому режимі "Додаткове озеро" (Навіть якщо це можливо, це жахлива ідея для багатьох причин -- див. різні аналізи, що показують численні перевагидецентралізовані системи) йERDDAPДизайнерські роботи зі світом як це. Кожен центр даних, який виробляє дані, можуть продовжувати підтримувати, вилікувати та зберігати дані (як вони повинні) і все ж, зERDDAP™, дані також можуть бути доступні з централізованогоERDDAP, без необхідності передачі даних до централізованогоERDDAP™або зберігання дублікатів даних. Дійсно, надана датасета одночасно доступна зERDDAP™в організації, яка випускається і фактично зберігає дані (Наприклад, GoMOOS) й зERDDAP™на батьківській організації (IOOS центральний) й від усьогоNOAA ERDDAP™й від урядуERDDAP™й від глобальногоERDDAP™ (ЗАМОВИТИ) й і від спеціалізованихERDDAPй (Наприклад,ERDDAP™в установі, присвяченому дослідженню HAB) й всі необхідні миттєво і ефективно, оскільки тільки метадані передається міжERDDAPs, не дані. Найкраще, після початковогоERDDAP™при виникненні організації, всі іншіERDDAPs можна швидко налаштувати (кілька годин роботи) з мінімальними ресурсами (один сервер, який не потребує ніяких RAID для зберігання даних, оскільки він зберігає дані локально) , і, таким чином, в дійсно мінімальній вартості. Порівняти це до вартості налаштування та підтримки централізованого центру даних з озерою даних та потребою в дійсно масивному, дійсно дорогих, підключення до Інтернету, а також присутньої проблеми централізованого центру обробки даних є єдиною точкою відмови. До мене,ERDDAPдецентралізований, федерований підхід далеко, відмінна.
У випадках, коли заданий дата-центр потребує декількохERDDAPs, щоб задовольнити високий попит,ERDDAP- дизайн повністю здатний відповідати або перевищення продуктивності багаторазово-ідентичного-ERDDAPs-with-a-load-balancer підхід. Ви завжди маєте можливість налаштуваннябагаторазовий композитнийERDDAPй (як обговорювати нижче) , кожен з яких отримує всі дані з іншихERDDAPs, без балансування навантаження. У цьому випадку я рекомендую, що ви робите точку надання кожного з композитуERDDAPs різне ім'я / ідентичність і при можливості їх налаштування в різних частинах світу (Наприклад, різні регіони AWS) , наприклад,ERD\_US\_East,ERD\_US\_West,ERD\_IE,ERD\_FR,ERD\_IT, так що користувачі свідомо, багаторазово, працюють з певнимиERDDAP, з доданою перевагою, що видалили ризик з однієї точки провалу.
Сітки, кластери та федерації
Під дуже важке використання, єдиний автономнийERDDAP™перейдемо в одну або більшеКонтактиперераховані вище і навіть запропоновані рішення будуть недостатньо. Для таких ситуаційERDDAP™має функції, які легко будувати стяжки сітки (також називають кластери або федерації) зERDDAPs, які дозволяють системі працювати дуже важко (Наприклад, для великого центру даних) й
Я за допомогоюсіткаяк загальний термін для позначення типукомп'ютерний кластерде всі частини можуть або не можуть бути фізично розміщені в одному об'єкті, або не можуть бути центрально введені. Перевага затишних, центральних і вмонтованих сіток (кластери) є те, що вони отримують користь від економіки ваги (особливо людське навантаження) і спростить створення деталей системи праці разом. Перевага нерозташованих сіточок, нецентрових і введенні (федерації) полягає в тому, що вони розподіляють людське навантаження і вартість, і можуть забезпечити додаткову толерантність до несправностей. Розчин я пропоную нижче добре для всіх сіток, кластерів та федераційних топографій.
Основна ідея проектування скасної сист еми полягає в тому, щоб визначити потенційні пляшки, а потім розробити систему так, щоб частини системи можуть бути відреаговані, як потрібно для полегшення пляшок. В ідеалі кожна реплікована частина збільшує потужність цієї частини системи лінійно (ефективність масштабування) й Система не масштабована, якщо не існує масштабованого розчину для кожної пляшки.Відповідальністьвідрізняється від ефективності (Як швидко зробити завдання — ефективність деталей) й Скальбільність дозволяє виростити систему для обробки будь-якого рівня попиту. ККД (масштабування і деталей) визначає, скільки серверів і т.д., буде потрібно для задоволення даного рівня попиту. Ефективність дуже важлива, але завжди має ліміти. Scalability - це єдиний практичний рішення для побудови системи, яка може оброблятися дуже важке використання. В ідеалі система буде масштабованою і ефективною.
Голоси
Мета цього дизайну:
- Щоб зробити масштабовану архітектуру (одна, яка легко посилюється, відреагуючи будь-яку частину, яка стає надмірною) й Щоб зробити ефективну систему, яка максимізує доступність та пропускну здатність даних, наданих наявними обчислювальними ресурсами. (Вартість практично завжди є проблемою.)
- Збалансувати можливості частини системи так, щоб одна частина системи не переповнена іншої частини.
- Щоб зробити просту архітектурну архітектуру, так що система легко встановлюється і адміністратора.
- Щоб зробити архітектуру, яка добре працює з усіма сітчастими топографами.
- Щоб зробити систему, яка не має витонченості і в обмежений спосіб, якщо будь-яка частина стає перезавантаженням. (Час, необхідний для копіювання великих даних, завжди обмежить здатність системи боротися з раптовим збільшенням попиту на конкретний гарнітур.)
- (При можливості) Щоб зробити архітектуру, яка не прив'язана до будь-якої конкретної конкретноїхмарні обчисленняпослуги або інші зовнішні послуги (бо не потрібно їх) й
Рекомендації
Наші рекомендації
- В основному, я раджу налаштувати CompositeERDDAP™ ( Р на схемі) , яка є регулярнимERDDAP™крім того, що він просто обслуговує дані з іншихERDDAPй Архітектура сітки призначена для перемикання якнайбільше робіт (Використання процесора, використання пам'яті, використання пропускної здатності) від CompositeERDDAP™до іншоїERDDAPй
- ERDDAP™має два спеціальні типи даних,EDDGridВідErddapіEDDTableЗ альбомуErddap, які відносяться до дані про іншіERDDAPй
- Коли композитERDDAP™отримує запит на дані або зображення з цих даних, складенийERDDAP™ перенаправленнязапит даних на іншіERDDAP™сервер. Результат:
- Це дуже ефективний (Процесор, пам'ять та пропускна здатність) , бо інакше
- СкладERDDAP™надсилання запиту даних іншимERDDAPй
- ІншеERDDAP™має отримувати дані, переформатувати та передавати дані до композитуERDDAPй
- СкладERDDAP™отримувати дані (за допомогою додаткової пропускної здатності) , переформатувати (Використання додаткового часу процесора та пам'яті) і передавати дані користувачеві (за допомогою додаткової пропускної здатності) й За допомогою перенаправлення запиту даних та отримання іншогоERDDAP™відправити відгук безпосередньо на користувача, композитERDDAP™не витрачає час на процесор, пам'ять або пропускну здатність на запити даних.
- Переадресація прозора для користувача незалежно від програмного забезпечення клієнта (веб-переглядач або будь-який інший інструмент для командного рядка) й
- Це дуже ефективний (Процесор, пам'ять та пропускна здатність) , бо інакше
Частини сітки
Р : Для кожного джерела даних, що має високу пропускну здатністьOPeNDAPсервер можна підключити безпосередньо до віддаленого сервера. Якщо віддалений серверERDDAP™, використанняEDDGridВідErddap або EDDTableЗ альбомуERDDAPподавати дані в CompositeERDDAPй Якщо віддалений сервер є іншим типомDAPсервер, наприклад, THREDDS,Hyrax, або GrADS, використанняEDDGridВідDap.
Б : Для кожногоERDDAPджерело даних (джерело даних з якихERDDAPможе читати дані) що має сервер високої пропускної здатності, встановити іншийERDDAP™в сітці, яка відповідає за надання даних з цього джерела даних.
- Якщо кілька такихERDDAPs не отримувати багато запитів для даних, ви можете консолідувати їх в однуERDDAPй
- ЯкщоERDDAP™для отримання даних з одного віддаленого джерела є занадто багато запитів, є спокуса додати додатковіERDDAPs для доступу до джерела даних віддалених даних. У спеціальних випадках це може відчувати себе, але швидше за все, що це передасть джерело даних віддалених даних (що таке самовизначення) а також запобігання іншим користувачам доступу до джерела даних (не приємно) й У такому випадку розглянемо налаштування іншогоERDDAP™для того, щоб подати інформацію про те, що одна з даних та скопіювати даніERDDAP's жорсткий диск (Переглянути Р ) , можливо, зEDDGridПартнерствота/абоEDDTableКопій
- Б сервери повинні бути загальнодоступними.
Р : Для кожногоERDDAP-надійне джерело даних, що має сервер низької пропускної здатності (або є повільним сервісом з інших причин) , врахувати налаштування іншоїERDDAP™і зберігання копії даних, на які булиERDDAP's жорсткий диск, можливо, зEDDGridПартнерствота/абоEDDTableКопій Якщо кілька такихERDDAPs не отримувати багато запитів для даних, ви можете консолідувати їх в однуERDDAPй Р сервери повинні бути загальнодоступними.
КомпонувальникERDDAP
Р : СкладERDDAP™є регулярнимERDDAP™крім того, що він просто обслуговує дані з іншихERDDAPй
- Через композитERDDAP™має інформацію в пам'яті про всі дані, вона може швидко реагувати на запити на списки даних (повнотекстові пошуки, пошук категорій, список всіх даних) , і запити для форми доступу до даних окремих даних, зробіть форму Графа абоWMSКонтакти Це всі невеликі, динамічно сформовані, HTML-сторінки на основі інформації, яка проводиться в пам'яті. Так відгуки дуже швидко.
- Ос кільки запити на фактичні дані швидко перенаправлені на іншіERDDAPs, композитERDDAP™може швидко реагувати на запити на фактичні дані без використання будь-якого часу процесора, пам'яті або пропускної здатності.
- Переміщення якомога більше роботи (CPU, пам'ять, пропускна здатність) від CompositeERDDAP™до іншоїERDDAPs, композитERDDAP™може з'являтися дані з усіх даних і все ще зберігатися з великою кількістю запитів даних з великої кількості користувачів.
- Попередні тести вказують на те, що композитERDDAP™може реагувати на більшість запитів в ~1ms час процесора, або 1000 запитів / секунду. Таким чином, 8-ядерний процесор повинен відповідати близько 8000 запитів/секунду. Незважаючи на те, що це можливо, для того, щоб зробити висновок про більш високу активність, яка призведе до уповільнення, тобто багато пропускної здатності. Ймовірно, що пропускна здатність центру даних буде довгою до композитуERDDAP™стає пляшечкою.
До сучасної макс. (час) ?
Про насEDDGrid/TableЗ альбомуErddap в композитіERDDAP™тільки змінює інформацію про кожного джерела, коли джерело даних"Завантажити"і деякі зміни метаданих (Наприклад, змінна часactual\_range) , тим самим генеруючи повідомлення про підписку. Якщо джерело даних має дані, які часто змінюються (наприклад, нові дані) і використовує"оновлення"система помітити часті зміни до основних даних,EDDGrid/TableЗ альбомуErddap не буде повідомлено про ці часті зміни до наступного набору даних "завантаження", томуEDDGrid/TableЗ альбомуErddap не буде ідеальною. Ви можете мінімізувати цю проблему, змінивши джерело даних<reloadEveryNMinutes> до меншого значення (60? 15?) так, щоб повідомлення про підписку більше, щоб розповістиEDDGrid/TableЗ альбомуErddap для оновлення його інформації про джерело даних.
Або, якщо система управління даними знає, коли джерело даних має нові дані (наприклад, через скрипт, який копіює файл даних на місце) і якщо це не дуже часто (наприклад, кожні 5 хвилин, або рідше) , є краще рішення:
- Не використовуйте<updateEveryNMillis> для збереження вихідних даних
- Набір вихі дних даних<reloadEveryNMinutes> до більшого числа (1440?) й
- У вас є скрипт контакту з вихідним данимипосиланняПісля копіювання нового файлу даних на місце. Це призведе до вихідних даних, які ідеально додаються до дати та викликати його для створення повідомлення про підписку, яка буде відправлена до джерела даних, які будуть надіслані на джерело.EDDGrid/TableЗ альбомуErddap Dataset. Що призведе доEDDGrid/TableЗ альбомуErddap Dataset, щоб бути ідеальною (добре, протягом 5 секунд додано нові дані) й І все, що буде зроблено ефективно (без зайвих перевантажень даних) й
Кілька композиційERDDAPй
- У дуже екстремальних випадках, або для толерантності до несправностей, ви можете налаштувати більше одного композитуERDDAPй Ймовірно, що інші частини системи (неможливий, пропускна здатність центру даних) стане проблемою до композитуERDDAP™стає пляшечкою. Ми можемо самі зателефонувати одержувачу і узгодити зручний час і місце вручення (дзеркала) , кожен з одним композитомERDDAP™сервериERDDAPй (принаймні) дзеркальні копії даних, які користуються великим попитом. Таке налаштування також забезпечує відмову та резервну копію даних (через копіювання) й У цьому випадку краще, якщо композитнийERDDAPs має різні URL-адреси.
Якщо ви дійсно хочете всі композитніERDDAPs для того, щоб мати однакову URL-адресу, використовуйте передню кінцеву систему, яка призначає користувача лише один з композитнихERDDAPй (на основі IP-адреси) , щоб всі запити користувачів надягали лише одну з композитнихERDDAPй Існує два причини:
- При перевантаженні основних даних та змінах метаданих (e.g., новий файл даних у сітчастому датасеті викликає зміни часуactual\_rangeзмінити) , композитнийERDDAPs буде тимчасово злегка з синхрону, але здоговірна консистенціяй Як правило, вони будуть повторно синтезовані протягом 5 секунд, але іноді це буде довше. Якщо користувач здійснює автоматизовану систему, яка спирається наERDDAP™підпискиякі запускають дії, суттєві проблеми синхронізації стануть суттєвими.
- 2+ композитнийERDDAPs кожен підтримує власний набір підписок (через синхронну проблему описану вище) й
Отже, заданий користувач повинен бути спрямований на лише одну з композитівERDDAPщоб уникнути цих проблем. Якщо один з композитівERDDAPs йде вниз, передня система може перенаправляти, щоERDDAPКористувачі іншихERDDAP™до. Однак, якщо це проблема ємності, яка викликає перший композитERDDAP™не вдається (надмірний користувач? затака denial-of-service?) , це дуже ймовірно, що перенаправлення своїх користувачів іншим композитнимERDDAPs буде викликативідмова від закупоркий Таким чином, найбільш надійні налаштування повинні мати композитнийERDDAPз різними URL-адресами.
Або, можливо, краще, встановити кілька композиційнихERDDAPбез балансування навантаження. У цьому випадку слід зробити точку надання кожного зERDDAPs різне ім'я / ідентичність і при можливості їх налаштування в різних частинах світу (Наприклад, різні регіони AWS) , наприклад,ERD\_US\_East,ERD\_US\_West,ERD\_IE,ERD\_FR,ERD\_IT, так що користувачі свідомо, багаторазово працюють з певнимиERDDAPй
- \[Для захоплюючого дизайну системи високої продуктивності, що працює на одному сервері, див. цедетальний опис Постінаторай\]
Дані в дуже високому попиті
У самому незвичайному випадку, що один з Р й Б або Р ERDDAPs не може зберігатися з запитами через смуги або обмеження жорсткого диска, він має сенс копіювання даних (знову) на іншому сервері+hard Привід+ERDDAP, можливо, зEDDGridПартнерствота/абоEDDTableКопій Хоча це може здатися ідеально, щоб мати оригінальні дані, і скопійовані дані з'являються безшовно, як один набір даних в композитіERDDAP™, це важко, тому що два дані будуть в дещо різних штатах в різні часи (ймовірно, після того, як оригінальний отримує нові дані, але перед тим, як скопіювати дані) й Тому я рекомендую, що дані будуть надані трохи різних назв (наприклад, "... (копія #1) " і "... (Копія #2) ", або, можливо, " (Дзеркало # п ) " або " (сервер # п ) « » » » » » » » » » » » » » ») і з'являються як окремі дані в композитіERDDAPй Користувачі використовуються для перегляду спискудзеркальні сайтина популярних сайтах для завантаження файлів, тому це не дивно або розчаровує їх. Через обмеження пропускної здатності на даній ділянці може мати сенс мати дзеркало, розташоване на іншому місці. Якщо дзеркальна копія знаходиться в різних дата-центрах, доступ до них просто композитний центр данихERDDAP™, різні назви (Наприклад: «Дзеркало No1») не потрібно.
RAID versus Регулярні жорсткі диски
Якщо великий набір даних або група даних не сильно використовується, це може бути сенс зберігати дані на RAID, оскільки він пропонує толерантність до несправностей і оскільки вам не потрібно переробляти потужність або пропускну здатність іншого сервера. Але якщо використовується датасет, то це може бути більше сенсу копіювання даних на іншому сервері +ERDDAP™+ жорсткий диск (схожий наЩо робить Google) замість того, щоб використовувати один сервер і RAID для зберігання декількох даних, так як ви отримуєте, щоб використовувати як сервер + HardDrive +ERDDAPs в сітці до одного з них не виходить.
Помилки
Що відбувається, якщо ...
- Є лопець запитів на один набір даних (наприклад, всі студенти класу одночасно запитують аналогічні дані) ? ТількиERDDAP™подавати дані, які будуть перевантажені та уповільнювати або відхиляти запити. СкладERDDAP™та іншіERDDAPне вражається. Оскільки граничний фактор для заданих даних в системі жорсткий диск з даними (немаERDDAP) , єдиний розчин (негайний) – зробити копію даних на іншому сервері+hardDrive+ERDDAPй
- Анжела Р й Б або Р ERDDAP™неспроможність (Наприклад, несправність жорстких дисків) ? Тільки дані (й) подається,ERDDAP™впливають. Якщо дані (й) на іншому сервері+hardDrive+ERDDAP, ефект мінімальний. Якщо проблема є несправністю жорсткого диска на рівні 5 або 6 RAID, ви просто замініть диск і маєте RAID, щоб відновити дані на диску.
- СкладERDDAP™чи? Якщо ви хочете зробити систему дужевисока доступністьВи можете налаштуватибагаторазовий композитнийERDDAPй (як обговорювати) , використовуючи щось схожеNGINXабоТрафикдля обробки балансування навантаження. Зверніть увагу, що дана композитнаERDDAP™може обробляти дуже велику кількість запитів від великої кількості користувачів, оскільки запити для метаданих є невеликими і обробляються інформацією, яка знаходиться в пам'яті, і запити на дані (що може бути великим) перенаправлення дитиниERDDAPй