Server Maintenance Checklist
Just like any other computer, Linux servers need periodic maintenance. Here are a twelve things to check on a regular basis to keep your system running smoothly. This is just a quick check list. It is not meant to be exhaustive or explain how to do these things, but keeping tabs on these items can reduce server issues. These are just some of the things we do as part of our server management work.
12 Server Maintenance Tips
1. Verify your backups are working. Before making any changes to your production system, be sure that your backups are working. You may even want to run some test recoveries if you are going to delete critical data. While focused on backups, you may want to make sure you have selected the right backup location.
2. Check disk usage. Don’t use your production system as an archival system. Delete old logs, emails, and software versions no longer used. Keeping your system free of old software limits security issues. A smaller data footprint means faster recovery should a disk fail. If your usage is exceeding 90% of disk capacity, either reduce usage or add more storage. If your partition reaches 100%, your server may stop responding, database tables can corrupt and day can be lost.
3. Check RAID Alarms. If you are using RAID (and you should be), check that your RAID’s error notification system is configured properly and works as expected. Most RAID levels tolerate only a single disk failure. If you miss a RAID notification, a simple disk replacement could turn into a catastrophic failure.
4. Update your OS. Updates for Linux systems are release almost daily. Many of these fix important security issues. At rackAID, we update systems daily (sometimes even more frequently). If you do not have a management service or auto-updates enabled, be sure to review your OS for any critical security updates. Get on the mailing list for your OS so you know when critical security patches are released. If you have a kernel update, you will need to reboot your server unless you use a took like Ksplice.
5. Update your Control Panel. If you are using a hosting or server control panel, be sure to update it as well. Sometimes this means updating not only the control panel itself, but also software it controls. For example, with WHM/cPanel, you must manually update PHP versions to fix known issues. Simply updating the control panel does not also update the underlying Apache and PHP versions used by your OS.
6. Check application updates. Most security issues we investigate are due to outdated web applications. After you have updated your server, be sure to review the web applications and update them as well.
7. Check remote management tools. If your server is co-located or with a dedicated server provider, you will want to check that your remote management tools work. Remote console, remote reboot and rescue mode are what I call the 3 essential tools for remote server management. You want to know that these will work when you need them.
8. Check for hardware errors. You may want to review the logs for any signs of hardware problems. Overheating notices, disk read errors, network failures could be early indicators of potential hardware failure. These are rare but worth a look, especially if the system has not been working within normal ranges.
9. Check server utilization.“ Review your server’s disk, CPU, RAM and network utilization. If you are nearing limits, you may need to plan on adding resources to your server or migrating to a new one.
10. Review user accounts. If you have had staff changes, client cancellations or other user changes, you will want to remove these users from your system. Storing old sites and users is both a security and legal risk. Depending on your service contracts, you may not have the right to retain a client’s data after they have terminated services.
11. Change passwords. I recommend changing passwords every 6 to 12 months, especially if you have given out passwords to others for maintenance.
12. Check system security. I suggest a periodic review of your server’s security using a remote auditing tool such as Nessus. Regular security audits serve as a check on system configuration, OS updates and other potential security risks. I suggest this at least 4 times a year and preferably monthly. Also, you may want to revisit the 10 immutable laws of security administration.
เซิร์ฟเวอร์ตรวจสอบบำรุงรักษา
เช่นเดียวกับคอมพิวเตอร์อื่น ๆ เซิร์ฟเวอร์ลินุกซ์จำเป็นต้องบำรุงรักษาเป็นระยะ นี่คือสิบสองสิ่งที่ต้องตรวจสอบเป็นประจำเพื่อให้ระบบของคุณทำงานได้อย่างราบรื่นเป็น นี่เป็นเพียงรายชื่อตรวจสอบอย่างรวดเร็ว มันไม่ได้หมายถึงจะหมดแรงหรืออธิบายถึงวิธีการที่จะทำสิ่งเหล่านี้ แต่การรักษาแท็บในรายการเหล่านี้สามารถลดปัญหาเซิร์ฟเวอร์ เหล่านี้เป็นเพียงบางส่วนของสิ่งที่เราทำในฐานะส่วนหนึ่งของการทำงานของเซิร์ฟเวอร์การจัดการของเรา.
12 เคล็ดลับการบำรุงรักษาเซิร์ฟเวอร์
1 ตรวจสอบการสำรองข้อมูลของคุณกำลังทำงาน ก่อนที่จะทำการเปลี่ยนแปลงใด ๆ ในระบบการผลิตของคุณให้แน่ใจว่าการสำรองข้อมูลของคุณกำลังทำงาน คุณอาจต้องการที่จะเรียกกลับคืนทดสอบบางอย่างถ้าคุณกำลังจะไปลบข้อมูลที่สำคัญ ในขณะที่มุ่งเน้นไปที่การสำรองข้อมูลที่คุณอาจต้องการที่จะให้แน่ใจว่าคุณได้เลือกสถานที่ตั้งการสำรองข้อมูลที่ถูกต้อง.
2 ตรวจสอบการใช้งานดิสก์ อย่าใช้ระบบการผลิตของคุณเป็นระบบการจัดเก็บ ลบบันทึกเก่า, อีเมล, และรุ่นซอฟต์แวร์ไม่ใช้อีกต่อไป การรักษาระบบของคุณฟรีของซอฟต์แวร์เก่า จำกัด ปัญหาด้านความปลอดภัย รอยเท้าขนาดเล็กหมายถึงข้อมูลการกู้คืนได้เร็วขึ้นดิสก์ควรจะล้มเหลว หากการใช้งานของคุณจะเกิน 90% ของความจุฮาร์ดดิสก์ทั้งลดการใช้หรือเพิ่มพื้นที่จัดเก็บเพิ่มเติม ถ้าพาร์ติชันของคุณถึง 100% เซิร์ฟเวอร์ของคุณอาจหยุดการตอบสนองตารางฐานข้อมูลสามารถเสียหายและวันจะหายไป.
3 ตรวจสอบสัญญาณเตือนภัย RAID หากคุณกำลังใช้ RAID (และคุณควรจะเป็น) ตรวจสอบว่าระบบการแจ้งเตือนข้อผิดพลาด RAID ของคุณมีการกำหนดค่าอย่างถูกต้องและทำงานตามที่คาดไว้ ส่วนใหญ่ระดับ RAID ทนเพียงความล้มเหลวของดิสก์เดียว หากคุณพลาดการแจ้งเตือน RAID, เปลี่ยนดิสก์ง่ายอาจจะเปลี่ยนเป็นความล้มเหลวหายนะ.
4 อัปเดตระบบปฏิบัติการของคุณ การปรับปรุงสำหรับระบบ Linux มีการเปิดตัวเกือบทุกวัน หลายเหล่านี้แก้ไขปัญหาด้านความปลอดภัยที่สำคัญ ที่ rackAID เราปรับปรุงระบบทุกวัน (บางครั้งบ่อยมากยิ่งขึ้น) หากคุณไม่ได้มีการจัดการบริการหรือการปรับปรุงอัตโนมัติที่เปิดใช้งานให้แน่ใจว่าได้ตรวจสอบการปฏิบัติการของคุณสำหรับการปรับปรุงการรักษาความปลอดภัยใด ๆ ที่สำคัญ รับในรายชื่อทางไปรษณีย์สำหรับระบบปฏิบัติการของคุณเพื่อให้คุณรู้ว่าเมื่อซอฟต์แวร์รักษาความปลอดภัยที่สำคัญมีการเปิดตัว หากคุณมีการปรับปรุงเคอร์เนล, คุณจะต้องรีบูตเครื่องเซิร์ฟเวอร์ของคุณถ้าคุณใช้เช่นเอา Ksplice.
5 ปรับปรุงแผงควบคุมของคุณ ถ้าคุณกำลังใช้โฮสติ้งหรือแผงควบคุมเซิร์ฟเวอร์ให้แน่ใจว่าจะปรับปรุงมันได้เป็นอย่างดี บางครั้งนี้หมายถึงการปรับปรุงไม่เพียง แต่แผงควบคุมตัวเอง แต่ยังซอฟแวร์ควบคุมมัน ตัวอย่างเช่นกับ WHM / cPanel, คุณต้องอัพเดตเวอร์ชั่น PHP ในการแก้ไขปัญหาที่รู้จักกัน เพียงแค่การปรับปรุงแผงควบคุมไม่ได้นอกจากนี้ยังมีการปรับปรุง Apache พื้นฐานและรุ่น PHP ใช้โดยระบบปฏิบัติการของคุณ.
6 ตรวจสอบการปรับปรุงโปรแกรม ส่วนใหญ่ปัญหาด้านความปลอดภัยเราจะตรวจสอบได้เนื่องจากการใช้งานเว็บที่ล้าสมัย หลังจากที่คุณได้รับการปรับปรุงเซิร์ฟเวอร์ของคุณให้แน่ใจว่าได้ตรวจสอบการใช้งานเว็บและปรับปรุงพวกเขาเช่นกัน.
7 ตรวจสอบเครื่องมือในการจัดการระยะไกล ถ้าเซิร์ฟเวอร์ของคุณร่วมอยู่หรือกับผู้ให้บริการเซิร์ฟเวอร์เฉพาะคุณจะต้องการที่จะตรวจสอบว่าการทำงานของเครื่องมือในการจัดการระยะไกลของคุณ คอนโซลระยะไกลรีบูตระยะไกลและโหมดการช่วยเหลือเป็นสิ่งที่ผมเรียกว่า 3 เครื่องมือที่จำเป็นสำหรับการจัดการเซิร์ฟเวอร์ระยะไกล คุณต้องการที่จะรู้ว่าสิ่งเหล่านี้จะทำงานเมื่อคุณต้องการพวกเขา.
8 ตรวจสอบข้อผิดพลาดของฮาร์ดแวร์ คุณอาจต้องการตรวจสอบล็อกหาสัญญาณของปัญหาฮาร์ดแวร์ใด ๆ ความร้อนสูงเกินไปประกาศดิสก์อ่านข้อผิดพลาดความล้มเหลวของเครือข่ายอาจจะเป็นตัวชี้วัดแรกของการล้มเหลวของฮาร์ดแวร์ที่มีศักยภาพ เหล่านี้เป็นของหายาก แต่คุ้มค่าดูโดยเฉพาะอย่างยิ่งถ้าระบบยังไม่ได้รับการทำงานในช่วงปกติ.
9 ตรวจสอบการใช้เซิร์ฟเวอร์. "ตรวจสอบดิสก์ของเซิร์ฟเวอร์ของคุณ, CPU, RAM และการใช้เครือข่าย หากคุณกำลังใกล้ขีด จำกัด ของคุณอาจจะต้องวางแผนที่จะเพิ่มทรัพยากรไปยังเซิร์ฟเวอร์ของคุณหรือการโยกย้ายไปยังหนึ่งใหม่.
10 บัญชีผู้ใช้ทบทวน หากคุณมีการเปลี่ยนแปลงพนักงาน, ลูกค้าหรือการยกเลิกการเปลี่ยนแปลงผู้ใช้อื่นที่คุณจะต้องการที่จะลบผู้ใช้เหล่านี้จากระบบของคุณ การจัดเก็บสถานที่เก่าและผู้ใช้มีทั้งการรักษาความปลอดภัยและความเสี่ยงทางกฎหมาย ทั้งนี้ขึ้นอยู่กับสัญญาบริการของคุณคุณอาจไม่ได้มีสิทธิที่จะเก็บรักษาข้อมูลของลูกค้าหลังจากที่พวกเขาได้ยกเลิกการให้บริการ.
11 รหัสผ่านที่เปลี่ยน ผมขอแนะนำให้เปลี่ยนรหัสผ่านทุก 6 ถึง 12 เดือนโดยเฉพาะอย่างยิ่งถ้าคุณได้ให้ออกรหัสผ่านไปยังคนอื่น ๆ สำหรับการบำรุงรักษา.
12 ระบบรักษาความปลอดภัยตรวจสอบ ผมขอแนะนำให้ทบทวนการรักษาความปลอดภัยของเซิร์ฟเวอร์ของคุณโดยใช้เครื่องมือการตรวจสอบระยะไกลเช่น Nessus ตรวจสอบความปลอดภัยปกติทำหน้าที่เป็นผู้ตรวจสอบการกำหนดค่าระบบการปรับปรุงระบบปฏิบัติการและความเสี่ยงที่อาจเกิดขึ้นอื่น ๆ ผมขอแนะนำให้นี้อย่างน้อย 4 ครั้งต่อปีและรายเดือนอย่างยิ่ง นอกจากนี้คุณอาจต้องการที่จะทบทวน 10 กฎหมายไม่เปลี่ยนรูปของการบริหารความปลอดภัย
การแปล กรุณารอสักครู่..
