การไล่สี
ERDDAP™- สัมภาระหนัก, กริด, คลูสเตอร์, สหพันธ์, และ การประกอบเมฆ
ERDDAP.
ERDDAP™เป็นโปรแกรมเว็บและบริการเว็บ ที่รวบรวมข้อมูลทางวิทยาศาสตร์ จากแหล่งต่าง ๆ ในท้องถิ่นและระยะไกล และเสนอวิธีง่ายๆ ที่ต่อเนื่องในการดาวน์โหลดสับเซตของข้อมูลในรูปแบบแฟ้มเดียวกัน และทํากราฟและแผนที่ เว็บไซต์ นี้ พิจารณา ประเด็น ที่ เกี่ยว ข้อง กับ ความ หนักERDDAP™การ ใช้ ของ หนัก และ การ สํารวจ ความ เป็น ไป ได้ สําหรับ การ จัด การ กับ ของ หนัก ที่ หนัก หน่วง มาก ๆ ผ่าน ทาง ตาราง, กระจุก ดาว, เครื่อง ดูด ฝุ่น, และ การ คํานวณ เมฆ.
- ต้นฉบับเขียนขึ้นในเดือนมิถุนายน 2009. ไม่มีการเปลี่ยนแปลงที่สําคัญ นี่เป็นการปรับปรุงล่าสุด 2019-04-15
เดซิลิเมก้า
เนื้อหาในเว็บเพจนี้ คือ บ็อบ ไซมอนส์ ความคิดเห็นส่วนตัว และไม่จําเป็นต้องสะท้อนให้เห็นถึงตําแหน่งที่รัฐบาลหรือNational Oceanic and Atmospheric Administration. การ คํานวณ เป็น แบบ เรียบ ง่าย แต่ ผม คิด ว่า ข้อ สรุป นั้น ถูก ต้อง. ผมใช้ตรรกะที่ผิดหรือคํานวณผิดพลาด? ถ้าเป็นอย่างนั้น ความผิดก็คือฉันคนเดียว โปรดส่งอีเมลพร้อมกับการแก้ไขไปยังerd dot data at noaa dot gov.
ภาระ หนัก / ข้อ ท้าทาย
ด้วยการใช้งานอย่างหนัก โดดเดี่ยวERDDAP™จะถูกบีบคั้น (จากมากที่สุดที่จะเป็นไปได้น้อยที่สุด) โดย:
แบนด์วิธทางไกล
- แบนด์วิธของแหล่งข้อมูลจากระยะไกล แม้จะมีการเชื่อมต่อที่มีประสิทธิภาพ (อี.จี. ผ่านOPeNDAP) ยกเว้นข้อมูลระยะไกล มีการเชื่อมต่ออินเทอร์เน็ตแบบแบนด์วิดสูงERDDAPการตอบรับจะถูกจํากัดด้วยความเร็วERDDAP™สามารถได้ข้อมูลจากแหล่งข้อมูล คําตอบคือคัดลอกชุดข้อมูลไปยังERDDAPฮาร์ดไดรฟ์ อาจจะด้วยEDDGridคัดลอกห รือโปรแกรมคัดลอก DDTable.
ERDDAPเครื่องแม่ข่ายแบนด์วิธ
- เว้นแต่ว่าERDDAPเซิร์ฟเวอร์มีการเชื่อมต่ออินเทอร์เน็ตแบบแบนด์วิธสูงมากERDDAPการตอบรับจะถูกจํากัดด้วยความเร็วERDDAP™สามารถได้ข้อมูลจากแหล่งข้อมูล และเร็วแค่ไหนERDDAP™สามารถคืนข้อมูลให้ลูกค้าได้ ทางแก้เดียวคือ เชื่อมต่ออินเทอร์เน็ตได้เร็วขึ้น
หน่วยความจํา
- ถ้ามีคําขอมากมายERDDAP™อาจหมดความทรงจํา และปฏิเสธคําขอใหม่ชั่วคราว (ERDDAP™มี กลวิธี สอง อย่าง ที่ จะ หลีก เลี่ยง และ ลด ผล ที่ ตา ม มา หาก เกิด ขึ้น.) ดังนั้นยิ่งหน่วยความจําในเซิร์ฟเวอร์ยิ่งดี บนเซิร์ฟเวอร์ 32 บิต 4+ GB เป็นสิ่งที่ดีจริงๆ 2 GB จะโอเค ไม่ขอแนะนําให้ใช้น้อยกว่า บนเซิร์ฟเวอร์ 64 บิต คุณสามารถหลีกเลี่ยงปัญหาได้เกือบทั้งหมด โดยได้รับหน่วยความจําจํานวนมาก ดูตั้งค่า /- Xmx และ - XmsสําหรับERDDAPทอมแคท ขนาดERDDAP™การใช้คอมพิวเตอร์อย่างหนัก โดยมีบริการบริการ 64 บิตที่มีหน่วยความจํา 8GB และ - Xmx ที่กําหนดเป็น 4000M แทบจะไม่ถูกจํากัดด้วยหน่วยความจํา
ไดรฟ์แบนด์วิธ
- การเข้าถึงข้อมูลในฮาร์ดไดรฟ์ของเครื่องแม่ข่ายนั้น เร็วกว่าการเข้าถึงข้อมูลจากระยะไกลอย่างมาก ถึงอย่างนั้นก็เถอะERDDAP™แม่ข่ายให้บริการมีการเชื่อมต่ออินเทอร์เน็ตแบบแบนด์วิดที่สูงมาก เป็นไปได้ว่าการเข้าถึงข้อมูลในฮาร์ดไดรฟ์ จะเป็นคอขวด คําตอบบางส่วนคือให้เร็วกว่า (e.g., 10,000 RPM) ฮาร์ดไดรฟ์แม่เหล็กหรือไดรฟ์ SSD (ถ้ามันสมเหตุสมผล ค่าใช้จ่ายอย่างชาญฉลาด) . ทาง แก้ อีก อย่าง หนึ่ง คือ เก็บ ชุด ข้อมูล ที่ ต่าง กัน ไว้ ใน ไดรฟ์ ต่าง ชนิด เพื่อ ว่า ฮาร์ดไดรฟ์ ที่ สะสม ไว้ จะ สูง กว่า มาก.
มีหลายแฟ้มที่ถูกแคชไว้
- มีแฟ้มมากเกินไปในแคชไดเรกทอรี —ERDDAP™จัดเก็บภาพทั้งหมด แต่จะบันทึกเฉพาะข้อมูลที่ร้องขอมา มันเป็นไปได้ที่ไดเร็กทอรีแคชสําหรับชุดข้อมูลจะมีแฟ้มจํานวนมากชั่วคราว นี่จะเป็นการชะลอการร้องขอเพื่อดูว่าแฟ้ มอยู่ในแคชหรือไม่ (จริงๆเลย!) .<แคช นาที@ labelตั้งค่า. xmlให้คุณตั้งค่าระยะเวลาของแฟ้มที่อยู่ในแคช ก่อนที่จะถูกลบ การหาเลขที่น้อยกว่า จะทําให้ปัญหานี้น้อยที่สุด
ตัวประมวลผลหลัก
- มี 2 อย่างที่ต้องใช้เวลา CPU มาก
- NetCDF4 และHDF5 ตอนนี้สนับสนุนการบีบอัดข้อมูลภายใน การ ทํา ให้ เกิด การ อัด แน่น อย่าง มากNetCDF4 /HDF5 ไฟล์สามารถใช้เวลา 10 หรือมากกว่าวินาที (นั่นไม่ใช่ความผิดพลาด มันเป็นธรรมชาติของการบีบอัด) ดังนั้น การร้องขอข้อมูลแบบพร้อมเพรียงกันหลายชุด กับข้อมูลที่ถูกเก็บไว้ในแฟ้มบีบอัด สามารถทําให้เกิดความเครียดอย่างรุนแรงบนเซิร์ฟเวอร์ใด ๆ ก็ได้ ถ้านี่เป็นปัญหา คําตอบก็คือ เก็บชุดข้อมูล ยอดนิยมไว้ในไฟล์ที่ไม่บีบอัด หรือเอาเซิร์ฟเวอร์ที่มี CPU ที่มีแกนมากกว่า
- สร้างกราฟ (รวมแผนที่ด้วย) – 1 วินาทีต่อกราฟ ดังนั้นถ้ามีการขอกราฟแบบไม่ซ้ํากันหลายแบบ (WMSลูก ค้า มัก จะ ขอ อย่าง พร้อม เพรียง กัน ถึง 6 ครั้ง!) อาจมีการจํากัด CPU เมื่อผู้ใช้หลายคนกําลังทํางานอยู่WMSลูกค้า, นี่กลายเป็นปัญหา
จํานวนตัวอักษรERDDAPมีกระสุนบาลาแนนซิ่งมั้ย
คําถามมักขึ้นมาว่า "เพื่อจัดการกับภาระหนัก ผมตั้งหลายเดียวกันได้ไหมERDDAPที่มีการโหลดสมดุล?" มันเป็นคําถามที่น่าสนใจเพราะมันได้รับได้อย่างรวดเร็วแก่แกนของERDDAPการออกแบบ คําตอบสั้นๆคือ "ไม่" ผมรู้ว่ามันเป็นคําตอบที่น่าผิดหวัง แต่มันมีเหตุผลโดยตรงอยู่สองสามข้อ และมีเหตุผลพื้นฐานบางประการERDDAP™เพื่อใช้วิธีการอื่น (ผู้ทรงเกียรติERDDAPS, ที่บรรยายในเอกสารนี้) ซึ่งผมเชื่อว่าเป็นทางออกที่ดีกว่า
เหตุผลตรง ๆ ว่าทําไมคุณถึงไม่สามารถ/ไม่ควรตั้งให้เหมือนกันได้ERDDAPS คือ:
- ให้ERDDAP™อ่านแฟ้มข้อมูลแต่ละตัวเมื่อเริ่มใช้ก่อน เพื่อหาช่วงของข้อมูลในแฟ้ม จากนั้นก็เก็บข้อมูลไว้ในแฟ้มดัชนี ต่อมา เมื่อผู้ใช้ร้องขอข้อมูลเข้ามาERDDAP™ใช้ดัชนีนั้นเพื่อหาว่าแฟ้มไหนที่จะค้นหาข้อมูลที่ร้องขอมา ถ้ามีหลายแบบเหมือนกันERDDAPS, พวกเขาแต่ละคนทําดัชนีนี้ ซึ่งเป็นการเสียความพยายาม ด้วยระบบหล่อเลี้ยงที่บรรยายด้านล่างนี้ การทําดัชนีเพียงครั้งเดียว โดยหนึ่งในERDDAPเอส.
- สําหรับการร้องขอของผู้ใช้บางประเภท (อี.จี. สําหรั บ.ncแฟ้ม .png, .pdf) ERDDAP™ต้องสร้างแฟ้มทั้งหมดก่อนที่จะส่งการตอบกลับ ดังนั้นERDDAP™จัดเก็บแฟ้มเหล่านี้เป็นเวลาอันสั้น ถ้าคําขอเดียวกันเข้ามา (โดยเฉพาะกับภาพที่มีที่อยู่ URL ฝังอยู่ในหน้าเว็บ) .ERDDAP™สามารถเรียกแฟ้มที่มีแคชใหม่ได้ ในระบบของหลายเดียวกันERDDAPs, แฟ้มที่จัดเก็บเหล่านั้นไม่สามารถใช้ร่วมกันได้, ดังนั้นแต่ละแฟ้มERDDAP™โดยไม่จําเป็น และสร้าง.ncไฟล์.png หรือ .pdf. ด้วยระบบ feedered ที่บรรยายด้านล่างนี้ ไฟล์ถูกสร้างขึ้นครั้งเดียว โดยหนึ่งในERDDAPเอส และใช้ซ้ํา
- ERDDAPระบบแบ่งรายการไม่ได้ตั้งให้ใช้ร่วมกันหลายระบบERDDAPเอส. ตัวอย่างเช่น ถ้าตัวชั่งโหลดส่งผู้ใช้ไปที่หนึ่งERDDAP™และผู้ใช้จะสมัครเข้าใช้ชุดข้อมูล และอื่น ๆERDDAPS จะไม่ทราบการสมัครสมาชิกที่ ในภายหลัง หากตัวจัดการการโหลดจะส่งผู้ใช้ไปยังตัวอื่นERDDAP™และขอรายชื่อสมาชิกของเขาERDDAP™จะบอกว่าไม่มี (นําเข า/เธอที่จะทําสมาชิกซ้ําในอีพีเออื่น ๆDAP) . ระบบ รับ ประทาน อาหาร ดัง ที่ พรรณนา ไว้ ข้าง ล่าง ระบบ บอก รับ เพียง แต่ จัด การ โดย ระบบ หลัก, ระบบ สาธารณะ, ประกอบERDDAP.
ใช่ สําหรับปัญหาแต่ละข้อ (ด้วยความพยายามอย่างมาก) วิศวกร วิธี แก้ (เพื่อแบ่งปันข้อมูลระหว่างERDDAPวินาที) แต่ฉันคิดว่าการบํารุงรักษาERDDAPกําลังเข้าใกล้ (คํา อธิบาย ส่วน ใหญ่ ของ เอกสาร นี้) เป็นคําตอบโดยรวมที่ดีกว่า, ส่วนหนึ่งเพราะมันเกี่ยวกับ ปัญหาอื่น ๆ ที่มีหลายตัวแปรERDDAPการใช้ S-ร่วมกับการโหลด-directer ไม่ได้เริ่มใช้ที่อยู่ โดยเฉพาะอย่างยิ่งธรรมชาติที่ผ่านการรับรองแล้วของแหล่งข้อมูลในโลก
มันดีที่สุดที่จะยอมรับความจริงที่ฉันไม่ได้ออกแบบERDDAP™ให้ใช้เป็นจํานวนเท่าเหมือนกันERDDAPกับตัวถ่วงดุล ฉันออกแบบอย่างมีสติERDDAP™เพื่อทํางานอย่างดีภายในการบํารุงรักษาERDDAPs ซึ่งผมเชื่อว่ามีประโยชน์หลายอย่าง โดยเฉพาะอย่างยิ่ง การดูดพลังERDDAPs สอดคล้องกับระบบข้อมูลที่เรียบเรียงแล้ว, การกระจายของศูนย์ข้อมูลที่เรามีในโลกแห่งความเป็นจริง (คิดถึงพื้นที่ไอโอเอสที่แตกต่างกัน หรือพื้นที่สังเกตการณ์โคสต์ต่างๆ หรือส่วนต่าง ๆ ของซีเอ็นไอ หรือศูนย์ข้อมูลอื่นๆ อีก 100 แห่งNOAAหรือ NASA DAACs หรือศูนย์ข้อมูล 1000 ของทั่วโลก) . แทนที่จะบอกศูนย์ข้อมูลของโลกว่า พวกเขาจําเป็นต้องละทิ้งความพยายามของพวกเขา และใส่ข้อมูลทั้งหมดไว้ในศูนย์กลาง "ทะเลสาบดาตา" (ถึงแม้ว่ามันจะเป็นไปได้ ก็เป็นความคิดที่น่ากลัวสําหรับเหตุผลมากมาย -- ดูผลวิเคราะห์ต่างๆ แสดงถึงประโยชน์มากมายของระบบที่ถูกปรับให้พอดี) .ERDDAPการออกแบบทํางานกับโลกอย่างที่มันเป็น ศูนย์ ข้อมูล แต่ ละ แห่ง ซึ่ง ผลิต ข้อมูล สามารถ คงทน, รักษา, และ ให้ ข้อมูล แก่ พวก เขา ต่อ ไป (พวกเขาควรจะ) และยังมีERDDAP™ข้อมูลสามารถใช้ได้ในทันที จากศูนย์กลางERDDAPโดยไม่ต้องส่งข้อมูลไปยังศูนย์กลางERDDAP™หรือเก็บสําเนาของข้อมูล จริง ๆ แล้ว ชุดข้อมูลที่ให้ สามารถใช้ได้พร้อมกัน จากERDDAP™ในองค์กรที่สร้างและเก็บข้อมูล (อี.) . จากERDDAP™ที่ องค์การ พ่อ แม่ (E.g., IOOS Central) . จากทุกคนNOAA ERDDAP™. จากรัฐบาลทั้งหมดERDDAP™. จากทั่วโลกERDDAP™ (โกส) . และจาก (มะลาอิกะฮฺ) ผู้ควบคุมอย่างรัดกุมERDDAPวินาที (เช่นERDDAP™ที่สถาบันที่อุทิศให้กับการวิจัย HAB) . โดยหลัก ๆ แล้ว ในทันใด และมีประสิทธิภาพ เพราะเพียง แต่ข้อมูลกํากับจะถูกโอนระหว่างERDDAPเอส ไม่ใช่ข้อมูล ดีที่สุด หลังจากเริ่มต้นERDDAP™ที่การจัดตั้งองค์กรทั้งหมดERDDAPเตรียมการได้เร็วมาก (ไม่กี่ชั่วโมง) ด้วยทรัพยากรที่น้อยที่สุด (เซิร์ฟเวอร์หนึ่งที่ไม่จําเป็นต้องใช้ RAID สําหรับจัดเก็บข้อมูล เนื่องจากไม่จัดเก็บข้อมูลภายในเครื่อง) ด้วยต้นทุนที่น้อยที่สุด เมื่อเทียบกับค่าใช้จ่ายในการตั้งและรักษาศูนย์ข้อมูลส่วนกลาง กับทะเลสาบข้อมูล และความต้องการขนาดใหญ่อย่างแท้จริง สําหรับผมแล้วERDDAPแนวทางที่เรียบร้อย ชุ่มชื้น เหนือกว่ามาก
ในสถานการณ์ที่ศูนย์ข้อมูลกําหนดต้องการหลายERDDAPเพื่อตอบสนองความต้องการERDDAPการออกแบบสามารถเข้ากันได้อย่างสมบูรณ์แบบ หรือมากเกินความสามารถของหลายมิติERDDAPใช้วิธีปรับสมดุล คุณมักจะมีทางเลือกในการตั้งเลเยอร์ERDDAPวินาที (ดัง ที่ พิจารณา กัน ข้าง ล่าง) แต่ละอันได้ข้อมูลทั้งหมดมาจากคนอื่นERDDAPS, ไม่สมดุลย์ ในกรณีนี้, ผมแนะนําให้คุณพูดถึง การให้องค์ประกอบแต่ละตัวERDDAPชื่อ / ชื่อ สมมุติ (E.g., ภูมิภาค AWS ที่แตกต่างกัน) อี.จี.ERD_สวรรคตERD[US / เวสต์,ERDI_iERD_FRERDIT เพื่อให้ผู้ใช้มีสติ, ทําซ้ํา, ทํางานโดยเฉพาะอย่างยิ่งERDDAPผลประโยชน์ที่เพิ่มขึ้นมาก็คือ คุณได้กําจัดความเสี่ยงนี้ออกจากจุดนึงของความล้มเหลว