系統管理員
基本介紹
系統管理員
網絡系統管理員主要負責整個網絡的網絡設備和服務器系統的設計、安裝、配置、管理和維護工作,為內部網的安全運行做技術保障。服務器是網絡應用系統的核心,由系統管理員專門負責管理;信息系統管理員則負責具體信息系統日常管理和維護,具有信息系統的最高管理權限。[1]
主要職責
基礎設施管理
(1)確保網絡通信傳輸暢通
(2)掌握主幹設備的配置情況及配置參數變更情況,備份各個設備的配置文件
(3)對運行關鍵業務網絡的主幹設備配備相應的備份設備,並配置為熱後備設備
(4)負責網絡布線配線架的管理,確保配線的合理有序
(5)掌握用戶端設備接入網絡的情況,以便發現問題時可迅速定位
(6)採取技術措施,對網絡內經常出現的用戶需要變更位置和部門的情況進行管理
(7)掌握與外部網絡的連接配置,監督網絡通信狀況,發現問題後與有關機構及時聯繫
(9)制定、發布網絡基礎設施使用管理辦法並監督執行情況[2]
操作系統管理
(1)在網絡操作系統配置完成並投入正常運行後,為了確保網絡操作系統工作正常,網絡管理員首先應該能夠熟練的利用系統提供的各種管理工具軟件,實時監督系統的運轉情況,及時發現故障徵兆並進行處理。
(2)在網絡運行過程中,網絡管理員應隨時掌握網絡系統配置情況及配置參數變更情況,對配置參數進行備份。網絡管理員還應該做到隨着系統環境的變化、業務發展需要和用戶需求,動態調整系統配置參數,優化系統性能。
(3)網絡管理員應為關鍵的網絡操作系統服務器建立熱備份系統,做好防災準備。
應用系統管理
(1) 確保各種網絡應用服務運行的不間斷性和工作性能的良好性,出現故障時應將故障造成的損失和影響控制在最小範圍內。
(2) 對於要求不可中斷的關鍵型網絡應用系統,除了在軟件手段上要掌握、備份系統參數和定期備份系統業務數據外,必要時在硬件手段上還要建立和配置系統的熱備份。
(3) 對於用戶訪問頻率高、系統負荷的網絡應用服務,必要時網絡管理員還應該採取分擔的技術措施。
用戶服務與管理
(1) 用戶的開戶與撤銷;
(2) 用戶組的設置與管理;
(3) 用戶可用服務與資源的的權限管理和配額管理;
(4) 用戶計費管理;
(5) 包括用戶桌面聯網計算機的技術支持服務和用戶技術培訓服務的用戶端支持服務。
安全保密管理
(1) 安全與保密是一個問題的兩個方面,安全主要指防止外部對網絡的攻擊和入侵,保密主要指防止網絡內部信息的泄漏。
(2) 對於普通級別的網絡,網絡管理員的任務主要是配置管理好系統防火牆。為了能夠及時發現和阻止網絡黑客的攻擊,可以加配入侵檢測系統對關鍵服務提供安全保護。
(3) 對於安全保密級別要求高的網絡,網絡管理員除了應該採取上述措施外,還應該配備網絡安全漏洞掃描系統,並對關鍵的網絡服務器採取容災的技術手段。
(4) 更嚴格的涉密計算機網絡,還要求在物理上與外部公共計算機網絡絕對隔離,對安置涉密網絡計算機和網絡主幹設備的房間要採取安全措施,管理和控制人員的進出,對涉密網絡用戶的工作情況要進行全面的管理和監控。
信息存儲備份管理
(1) 採取一切可能的技術手段和管理措施,保護網絡中的信息安全。
(2) 對於實時工作級別要求不高的系統和數據,最低限度網絡管理員也應該進行定期手工操作備份。
(3) 對於關鍵業務服務系統和實時性要求高的數據和信息,網絡管理員應該建立存儲備份系統,進行集中式的備份管理。
(4) 最後將備份數據隨時保存在安全地點更是非常重要。
機房管理
(1) 掌握機房數據通信電纜布線情況,在增減設備時確保布線合理,管理維護方便;
(2) 掌管機房設備供電線路安排,在增減設備時注意負載的合理配置;
(3) 管理網絡機房的溫度、濕度和通風狀況,提供適合的工作環境;
(4) 確保網絡機房內各種設備的正常運轉;
(5) 確保網絡機房符合防火安全要求,火警監測系統工作正常,滅火措施有效;
(6) 採取措施,在外部供電意外中斷和恢復時,實現在無人值守情況下保證網絡設備安全運行;
(7) 保持機房整潔有序,按時記錄網絡機房運行日誌,制定網絡機房管理制度並監督執行。
其它管理
(1) 配合其它部門進行部門局域網絡的建設,提出規劃、標準。
(2) 配合保衛部門,對網絡不良行為進行取證。
(3) 做到網絡中心服務反饋工作,及時通報網絡運行信息。
基本要點
負責流程與制度的完善
(1)根據規範、流程及產品說明等具體進行網絡與系統服務器的日常維護、配製、安裝等;
(2)在實踐中及時反饋發現的問題並協助解決,並根據實踐為流程與制度的完善提供意見;
負責系統的優化
根據對網絡和系統在性能容量、可靠性、安全性等方面的分析,為系統優化提供建議,並執行系統的優化工作,提高網絡與系統的效率;
負責系統的日常維護
(1)維護公司網絡系統、電話系統的安全,保障網絡可靠的運行;
(2)協助上級維護公司數據庫,保證公司各服務器設備的正常運行;
(3)維護保養計算機、網絡硬件設備、系統軟件、應用軟件等相關IT設施;
(4)診斷並排除設備及軟件故障;
負責文檔管理
編制、整理系統文檔,記錄IT設備及其使用狀況,實現系統文檔管理的規範化;
技能培訓
(1)及時為公司各部門計算機及網絡正常運作提供技術支持,提高辦公效率;
(2)協助上級編制計算機基礎知識、常用軟件和其它管理軟件的使用教材,協助上級開展培訓,為最終用戶提供IT技術支持。
職業定位
首先,計算機網絡管理員是一個「先存在而後有定義」的職業
計算機網絡管理員(簡稱網管員)是一個蓬勃發展的新興職業,在短短的幾年內,已成為絕大多數企業中必設的工作崗位,也成為眾多年輕人嚮往的職業。而網管員同時也是一個「先存在而後進行定義」的職業,網管員職業標準的滯後以及傳統教育的缺失,使得社會普遍對這個職業存在着很多疑惑,不管是求職者,還是用人單位都存在着如下的疑問:什麼是合格的計算機網絡管理員?一個計算機網絡管理員需要從事什麼樣的具體工作?作為網絡管理員必備的技能是什麼?如何培養合格的計算機網絡管理員?而對「網管員」從業人員來講,如何獲得相關知識和技能呢?
其次,網管員要建立終身學習的理念
終身學習是對傳統教育的觀念、體系、結構、組織的終結者。其價值理念源自當代社會知識爆炸和信息急劇增長的現狀,已成為現代一種新的生活方式。傳統知識教育中並沒有針對網管員職業設置的專業,另外,注重理論的講授無法滿足強調動手能力的工作要求。從業人員只能通過在工作中不斷地學習和探索來滿足崗位的需求;而另一方面,IT技術無疑是這個時代發展最為迅猛的技術之一,其普及與應用的速度也是無與倫比。這就要求「網管員」必須建立終身學習的理念,通過參加培訓、自學、交流等種種渠道學習和掌握最新、最實用的技術,構建和完善自身的技術體系。
最後,什麼是合格的計算機網絡管理員?一個計算機網絡管理員需要掌握哪些技能呢?
依據企業的業務性質與規模不同,對網管員的工作要求也有較大的差異。IT信息系統規模大的企業,分工較細,網管員可能只需要負責計算機機房的網絡運行和維護;而一些小型企業,只設一個網管員,他(她)可能不但要負責IT系統運行維護中的設備管理,還要負責網絡管理和系統管理,還有的企業需要網管員進行一些簡單的網站建設和網頁製作等工作。
總之,對網管員的要求基本就是大而全,不需要精通,但什麼都得懂一些。所以,總結下來,一個合格的網絡管理員最好在網絡操作系統、網絡數據庫、網絡設備、網絡管理、網絡安全、應用開發等六個方面具備紮實的理論知識和應用技能,才能在工作中做到得心應手,遊刃有餘。
必備技能
用戶管理
無論是UNIX還是NT,對於用戶的管理都是居於第一位的,作為一個新手,首先必須立刻掌握對用戶的增加和刪除以及限制等操作。這包括兩個方面: 一個是學會使用友好的圖形界面的管理工具集,在SUN Solaris系統中是Openwin環境下的/usr/bin/admintools工具集;在SCO UNIX中使用Sysadmsh管理Shell來管理用戶;在Novell系統中,則只需使用Syscon菜單即可完成用戶及用戶組的添加、刪除以及限制設置等等,多用戶的同批管理,則使用makeusr和userdef實用程序來做;在NT中,則使用程序組中管理工具(公用)組下的域用戶管理工具或用戶管理工具。使用這些工具,就可以十分簡單明了地進行用戶的創建、刪除以及鎖定和權限限制等操作。在NT下用戶組的管理和控制面板中的系統屬性程序管理用戶環境設置簡要文件,使用System Policy Editor配置一個域範圍的基於計算機或用戶的配置以及編寫登錄腳本。
二是學會字符命令行下的用戶管理,主要在UNIX或Linux環境下,包括用編輯工具Vi、emacs等對/etc/passwd進行操作或直接使用addusr、deleusr等用戶管理命令以及使用pwconv命令使/etc/passwd與shadow文件保持一致,使用SCO的/etc/rmuser命令刪除用戶,用newgrp命令將用戶添加到新組,另外包括用戶目錄的建立命令mkdir,賦於用戶屬性和組屬性命令chown和chgrp,以及用戶區域限制命令quota限制用戶區域大小,用來避免用戶區域占用硬盤空間過大,而使系統崩潰。其中,特別提醒一點,如果想對用戶權限進行嚴格限制時,用戶的註冊shell可使用/usr/lib/rsh。用戶的.profile和.login文件可使用系統標準的配置文件,或者也可在.profile中進行相應設置,用SU命令或SU Username進入用戶環境以進行具體檢測。另外,對用戶的消息發布系統,在NT中是使用Alert功能發出,對遠程主機則使用Server Manager中的computer|send message功能。在Novell中採用send命令。在UNIX中是使用wall或write指令,也可使用每日消息文件/etc/motd或news命令發出/usr/new文件內容。
安全及日誌管理
作為一個系統管理員,必須要能對系統事故找到故障原因,這就涉及到必須對系統的各項日誌進行察看分析。在NT中是使用Administrative Tools菜單中Event Viewer查看系統的SYSTEM、SECURITY、APPLICATION日誌文件。對Netware而言,錯誤日誌是SYS$LOG.ERR文件,通過syscon菜單中supervisor options下view file server errorlog觀察記錄,另外文卷錯誤日誌文件是各文卷中的VOL$LOG.LOG以及事務跟蹤處理系統錯誤日誌文件SYS:文卷中的TTS$LOG.ERR文件;UNIX中各項日誌包括/usr/adm目錄下的系統錯誤登記文件message、使用su命令的記錄文件sulog、每個用戶記錄上次註冊時間的登記文件lastlog、系統中註冊用戶的有關信息文件wtmp、每個用戶所執行命令的內容項文件acct以及/etc目錄下當前註冊用戶的有關信息文件utmp和其他應用程序產生的日誌文件。對於其中的一些日誌文件,可以採用who或w命令查看當前系統的登錄使用者(XENIX系統中還可以用whodo命令確定當前用戶的行為);last命令查看以前的登錄情況,這些命令都可以合併使用grep進行條件控制選擇過濾;用find查看文件及其屬主,特別監控具有根訪問權的進程及文件以及檢查開機文件/etc/inetd.conf、/etc/rc.local、/etc/passwd和corn或at運行的文件,並用corntab -l 與corntab -r命令對用戶的corntab文件進行列出與刪除管理;使用ls -lR生成主檢查表,並定期生成新表,使用diff命令進行比較,並使檢查通過的新表成為新的主檢查表,直到下一次檢查為止。個人強烈建議在inetd.conf中注釋掉所有的r打頭的命令文件,以及去掉/etc/hosts.equiv中的所有項並不允許用戶設立個人的.rhosts文件,使可信主機不予設立或為空以加強系統的安全。
系統進程管理
在UNIX中,系統報告命令包括df用來報告自由磁盤塊數;du用來總結磁盤使用狀況;nice用來改變某個命令所設優先權;Pstat用來報告系統信息,如節點表或進程表;sar用來報告系統的活動狀態如CPU的使用和緩衝區的活動狀況;time用來打印過去的時間、系統時間以及命令的執行時間;uptime用來報告系統的活動狀況,如系統啟動時間及已運行時間;vmsfat用來報告頁數及系統統計數字,如分支點的情況。BSD UNIX中的ps -aux或system V中的ps -ef以及LINUX中的ps aux用來查看進程狀態及其宿主,並使用kill命令及時停止不正常的進程。在NT中則使用Task Manager查看cpu和內存的使用情況,進行進程管理,另外也使用performance monitor進行狀態監控,以及時做出調節。值得注意的是,隨着網絡應用的擴大,病毒成為對網絡安全的一大威協。為此,在網絡上安裝病毒檢測和清除工具已經成為網絡管理必須要做的。
備份管理
作為一個較重要的系統,及時備份是必需的,那麼在一開始就必須養成及時定時備份的習慣。掌握備份的基本方法和步驟,以及使用基本的備份還原命令,如:NT中使用管理工具集中的NTBackup程序。因在Backup中不存在調度能力,備份必須手工完成或用AT命令行實現調度;以及採用第三方的備份解決方案。UNIX中系統V使用tar、cpio以及backup、restor、rolcopy,BSD中則使用tar、dump、restor等等,SCO中使用sysadmin進行文件系統後備和恢復文件。備份還必須制定計劃,指定何時進行何種備份,包括全集備份和遞增備份,如可以每周做一次全集備份,每天進行一次遞增備份,或者如系統不經常變化,則可每月一次全集備份,每周一次遞增備份。恢復與容錯管理 當系統出現故障時,作為系統管理員必須能定位並解決問題,這依賴於對控制台出錯信息以及日誌文件的分析,更重要的是平日的備份以及應急系統盤的製備。對於NT而言,是建立系統引導盤、緊急修復盤等,並使用Disk Adminstrator建立鏡像等RAID操作。對於UNIX而言,也依賴於系統安裝盤與緊急修復盤的建立。特別地,系統做任何改動後,都要重新生成新的系統恢復盤,並進行同步備份和使用單用戶模式來排除系統的絕大部分問題,即啟動時使用boot -single命令,這是一個關鍵。當然,管理員的口令是絕對不能忘記的,否則,那會造成很大麻煩,但對於管理人員而言,自己以及其它用戶都加上口令的使用限制,如口令字長度和日期限制以及其它限制,是非常必要的。太過簡單的口令往往會造成不安全的隱患。在容錯上則還包括經常地運行各類維護系統命令,如超級塊維護命令SYNC,文件系統檢查命令fsck。
文件系統與開關機管理
在所有的多用戶系統中,由於廣泛採用文件緩衝,使對文件的修改在內存進行之後再寫入磁盤,內核程序定時刷新這些緩衝區,以保持文件與緩衝區間同步。因而,不終止系統就關機,往往會造成同步的破壞,而出現文件系統的錯誤。在NT中,使用啟動菜單中的關閉系統選項來關閉系統;UNIX則採用shutdown、halt(haltsys)、reboot等命令。一般推薦使用shutdown加參數來關機或進入單用戶備份狀態,直到完成關機程序後,才能關閉電源,無論如何,這是必須牢記的。
另外,在維護文件系統時,應經常運行超級塊一致命令sync,文件系統檢查及錯誤修改命令fsck,新建一個文件系統時使用mkfs命令,系統V的fsstat將報告文件系統的狀態,以及設備管理命令mount、umount。 NOVELL中採用FILER菜單管理文件服務器的文件系統。
網絡管理
網絡管理,包括對E-mail、DNS以及WWW的調試。對於E-mail而言,是使用sendmail -bt -C filename進行,或先mail user,再telnet host 110,通過user username;pass passwd;list;retr *;quit等pop3命令進行調試。對於DNS,則使用nslookup命令進行域名解析,看能否正確解析出IP地址。對於WWW,則是通過瀏覽器進行檢查。另外是察看~/httpd/下的瀏覽日誌,對於NT而言,則通過管理工具下的server manager察看各服務程序是否正常運行,其餘檢測步驟則與UNIX系統相同,只是不使用sendmail命令,而採用telnet host 25,用helo host,send from:< yourname@hostname >, rcpt to:< username@hostname >,data,messagebody,「.」,exit等smtp命令進行檢測,POP3命令都相同。WWW的管理則直接通過http形式的在線管理方式進行,操作簡易明了,應該不會有什麼問題。 另外,在網絡日常管理中,則包括使用ping察看網絡連接狀態,netstat察看協議統計數據和當前網絡的連接狀態,ifconfig進行網絡接口設置,tracert進行路由狀態監察。對NT系統而言,除以上命令外,還包括使用/winnt/system32/Regedit32來控制註冊表,以及IPconfig察看IP設置,以及用與NT server配套的Network monitor進行網絡負載和性能統計。Novell系統中則使用NETADMIN實用程序或圖形界面的管理工具Netware Adminstrator來管理和規劃網絡,以及用monitor菜單監控本地服務器的各項狀態。相對於UNIX的第三方工具集,能夠作為管理者運行的網絡管理軟件主要有HP的OpenView、BAY的optivity、IBM的Netview和SUN的SunNetManager。
管理員面試
你的技術背景怎樣?
鑑於系統管理員角色的不同範圍,專業教育的要求也各不相同。大多數系統管理員工作需要在計算機科學領域有堅實的基礎,如工程學士學位。一些組織要求擁有入門級認證,如CompTIA Server+或者類似的特定技術認證,如微軟認證專家(Microsoft Certified Professional)或VMware Certified Associate - Data Center Virtualization(VCA-DCV)。
雖然這個答案的預期結果有很大的靈活性,但了解你的差距,然後準備對此進行討論。如果你沒擁有任何具體的認證,你是否有相關或類似的經驗?例如,如果職位要求擁有VMware Certified Professional 5 - Data Center Virtualization認證,而你擁有VCA-DCV,可以討論你的專業知識與相關應用類似技術技能的項目。
面試前,確認你的所有證書都在有效期內,並且和認證服務商確認數據庫中你的資料是否正確。潛在僱主可能查詢這些信息在微軟、VMware或CompTIA以及其他組織的有效性。過期的、老舊的或者互相矛盾的信息都會讓你吃大虧。
應對這個面試問題還可以展示你對企業價值與能力的評估方式。在描述教育經歷和認證時,強調每個證書是如何幫助你的;展示每個教育投資的戰略意義。
你的操作系統與服務的使用背景與經驗如何?
系統管理員需要保證服務器與終端節點的配置、優化與雲頂運行,所以面試會不可避免的轉向服務器硬件、操作系統,如微軟Windows Server 2012 R2,Vmware Vsphere虛擬化管理程序,以及網絡服務的規模與應用,如活動目錄、域名系統、動態主機配置協議、虛擬專用網等。
僱主希望能了解你的領域範圍以及是否與他們的IT基礎設施核心技術匹配。典型的回應方式是:談談你負責的任務以及任何特殊項目,如測試安裝操作系統補丁,或者管理服務器升級到Windows Server 2012 R2。不用擔心你的經驗是否能匹配每項要求,因為輔助技能可以加強工作能力。
如何處理用戶與終端系統支持?
系統管理員的角色通常都超出數據中心並延伸到最終用戶以及他們的設備。 在面試中回應這樣的問題是一個契機,可以突出你熟悉幫助台工單系統以及遠程桌面管理,尤其是在具有很多雇員的大企業中。
限定討論框架是一個有效的方案。他們已經知道你可以給Windows打補丁、升級或者安裝內存等。證明你了解用戶支持與清晰溝通的商業價值,能夠使用工具來解決問題並快速恢復功能。說明使用的具體工具,並強調它們能帶來的收益。
突出你在其他數據中心設備管理的經驗與能力,比如控制最終用戶訪問,防火牆、路由器與交換機的管理背景。闡述自己對一些系統管理工具,如Splunk與Nagios的專業知識。
如何管理系統性能
系統管理員要定期監控系統的可用性與性能。僱主一般會要求在面試系統管理員時回答兩個問題,以了解他們對硬件運行的預期以及可接受的資源利用率水平評估,如備份計劃任務,注意錯誤以及檢查重點事件日誌的能力等等。
數據中心決策需要堅實的指標。專注於能夠服務於你當前角色的關鍵績效指標(KPI)。這些指標範圍可以從CPU、內存與磁盤利用率這類主機級別到服務器虛擬機工作負載數量顆粒度。
注意每個KPI對業務都是十分重要的。也許你正在觀察每台主機的虛擬機數量或服務器起源,因為你正試圖通過回收未充分利用的資源以提高虛擬機整合度。如果你不知道自己所關注的每個KPI代表什麼,那可能是一個危險的信號。
在談話中可以援引注入SolarWinds、ManageEngine或Nagios等具體的監控與管理工具。向你的潛在僱主介紹這些內容——表明你可以很輕鬆的從一個工具過渡到另一個。
如何在當前角色的情況下處理備份與恢復作業
系統管理員將物理與虛擬備份存儲到各種媒體、存儲層或歸檔子系統中。 熟悉特定的備份工具並理解健全的備份與恢復實踐十分重要,所以聊聊你所採用的工具,如CommVault Enterprise Backup Software或 Symantec NetBackup。恢復往往是任何數據保護策略中最弱的一環,所以要強調驗證或測試備份的方法,以保證可恢復性。例如通過複製把虛擬機還原到測試服務器上,以驗證備份的完整性。
備份與恢復同樣影響數據保留、法律發現和相關的數據安全問題,如 數據竊取與法規遵從。搶手的系統管理員了解能夠解決這些重要業務問題的備份方式。例如,如果你的簡歷背景包括數據管理,那麼在面試時可以討論歸檔或銷毀數據的方法。
每個系統管理員都必須了解的領域
你曾經解決過的最棘手問題是什麼?
這是面試中最能推動候選人的一個問題。系統管理員是專業的疑難解決專家,能夠識別和解決在硬件、軟件、網絡、服務和應用上的問題。
有些系統管理員面試還包括一個簡單故障排除測試場景。突出最近的經驗來強調你的診斷過程與專業知識。在短短的一個例子中,你可以闡述如何確定問題,利用系統日誌來縮小問題範圍,並使用PerfMon等查用工具來試驗性能,用PowerShell來查詢或更改配置數據,以及這一系列步驟最後得出的解決方案。
為潛在僱主展示,你能夠運用理性並充分利用診斷工具來解決問題,並且快速恢復功能。着重突出在處理過程中可以保障應用與服務可用,如從故障服務器上遷移工作負載。
如何管理虛擬化服務器這個過程
不要被這種類型的面試所迷惑。虛擬化無疑是一個重要技術,系統管理員應當具備虛擬機管理程序的詳細知識,所以着重突出你使用管理程序或混合管理,以及遠程管理(物理服務器與虛擬機)的經驗。
但不要只局限於此。
這個問題講究的是策略,而不僅僅是技術的討論。作為一個領導角色,你要如何權衡、組織與執行這項新興技術在數據中心的部署?IT能提供怎樣具有成本效益的服務,提升企業的競爭力。
這是一個站出來成為經理的好機會。談論如何評估虛擬機管理程序,如何確定哪些工作負載需要虛擬化、進行性能測試並保障決策過程,以及如何從虛擬化技術中最大化用戶與商業利益。
參考文獻
- ↑ 系統管理員崗位職責6篇應屆畢業生網
- ↑ 網絡管理員基本知識學習啦