Professional Documents
Culture Documents
Bao Viet - Operation N Monitoring - v2 PDF
Bao Viet - Operation N Monitoring - v2 PDF
Name Value
IP 10.29.113.22
Hostname BVSolar-ESX01
OS ESXi 5.1
Datastore 01 300 GB
Datastore 02 300 GB
Management Network 10.29.113.22
Interface
Vswitch0 Ethernet Card 01
Ethernet Card 02
Vswitch1 Ethernet Card 03
Ethernet Card 04
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
- 1 VM DB
1. Application server
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
Name Value
IP 10.29.113.12
Hostname BVSolar-App01
OS Windows 2008 R2
Hard disk 01 80 GB
Network Interface 01 10.29.113.12
Network Interface 02 10.29.116.14
Installed Software Internet information service 7
Network Performance Monitor 10.6
NetFlow Traffic Analyzer 3.11
Server & Application Monitor 6.0.1
2. Database server
Name Value
IP 10.29.116.16
Hostname BVSolar-DB01
OS Windows 2008 R2
Hard disk 01 80 GB
Hard disk 02 200 GB
Network Interface 01 10.29.116.16
Installed Software Internet information service 7
Network Performance Monitor 10.6
NetFlow Traffic Analyzer 3.11
Server & Application Monitor 6.0.1
+ Managed devices – thiết bị được giám sát (server, router, switch, PC, printers…)
+ Agents – module được cài trên managed devices, dịch thông tin sang SNMP format.
2. MIB – Management Information Base – tập hợp các thông tin được tổ chức 1 cách có hệ thống. Thông
tin này được truy cập bởi các giao thức như SNMP.
3. OID – Object Identifiers – Chỉ ra các managed objects trong MIB hierarchy. Mỗi hãng sẽ có 1 OID riêng.
2. Managed devices gửi lại responses: Chứa thông tin mà management system yêu cầu.
- Ngoài ra, trap có thể được gửi lại Management System nếu như các giá trị monitored vượt quá
ngưỡng.
- MIB là virtual DB sử dụng để quản lý các thực thể trong network communications.
* Sử dụng monitor SNMP sẽ cho admin biết được nhiều thông tin hơn là ICMP.
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
- SolarWinds quản trị các node bằng cách lấy thông tin trong các WMI classes,instances,object của các
remote nodes.
+ Kết nối thực hiện bằng giao thức RPC – Remote Procedure Call.
- WMI management trong Windows System thường đi kèm với 1 khái niệm nữa là DCOM:
+ Cung cấp các interfaces cho phép nhiều clients và nhiều servers nói chuyện với nhau trong cùng 1
computer.
- RPC: Giao thức cho phép local API thực hiện remote functions.
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
+ Servers
+ Antivirus…
1. Server này quản trị Database của SolarWind. Thành phần quan trọng nhất là SQLServer
(MSSQLSERVER) Agent: Agent này sẽ thu thập thông tin quản trị của toàn bộ hệ thống SQL server.
- Trong troubleshoot, có khi service chết nhưng Agent nhiều khi lại không sao thì vẫn không phát hiện
được.
- Sau khi start xong instance của SQL Server thì sẽ có thêm 2 cái:
- Login vào application servers qua Web GUI, giao diện Node & Group Management.
- SolarWind có thể tự detect được các node trong mạng để đưa ra gợi ý các resource cần giám sát.
+ NOC chỉ có thể vận hành và giám sát được 1 số node thường xuyên.
+ IP
+ Port
+ Polling method: SNMP & ICMP. Ping đến node đó; gửi SNMP đến node đó.
+ Application monitor – nếu có application default rồi thì không cần quan tâm.
+ Poller – components mà truy vấn status của node thường xuyên. Có default poller rồi thì thôi.
+ Custom properties:
Environment - Production, Test, Dev, UAT (User Application Testing environment- môi trường mà
các hệ thống, ứng dụng được test trong "real world" environment).
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
4.2 Applications
4.2.1 Phân loại applications cần monitor
- Network protocols
- API components.
- Login:
1. Liên quan đến Polling rate. Nếu đạt đến max thì không thể monitor được nữa. Cần phải add thêm
monitoring servers mới.
Polling Rate
3. Backup/ restore.
4. Check DB size:
- Host: 10.29.116.16
- Directory: D:\MSSQL10.MSSQLSERVER
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
- Dùng tool Report Writer. Bổ sung thêm report group, report title vào.
7 Troubleshooting
7.1 Troubleshooting Network Performance Monitor - NPM
7.1.1 Overall network performance monitor
- Tool: Orion NPM:
- ----------
Services:
Message Queuing
- SQL Server:
----------
- Có thể dùng shell scripts để export ra status của các services, hoặc dùng GUI để kiểm tra.
+ Điều kiện: tắt các ứng dụng khác + stop SolarWind Network Performance Monitor Service.
1. SQL
- Filename: tempdb – file temp cho các object tạm thời phát sinh trong qua trình tạo bảng, sắp xếp.
- Thường ở cùng directory với các DB khác như master, model, mssdb.
- Cho tempdb vào 1 separate disk drive tối ưu hóa I/O của HDD.
+ Name of temdb
+ Name
2. Windows.
- Orion NPM sử dụng các thành phần sau để chạy chương trình:
+ Windows users.
+ System TEMP
Cần phải tạo giá trị mặc định cho 3 mục trên.
Server 1
Server 2
Orion
Application Database
High-traffic network
- Windows Server 2008/Window Vista được cài Orion trong môi trường:
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son
+ Không support RFC1323 – TCP Extensions for High Performance giữa Orion Server vs Database server.
Tính năng tự động điều chỉnh Windows size sẽ cản trở connection giữa Orion server Database
Server. Do tính năng này sẽ tự động bóp traffic rate từ DB server về Orion server.
- TCP Windows size: lượng dữ liệu tối đa được đệm trong 1 lần ở phía receiver trong 1 connection.
+ Sender chỉ có thể gửi đi lượng dữ liệu này, trước khi đợi receiver phản hồi lại bản tin
acknowledgement + window update (kích thước window size mới).
+ Đây là phương pháp mà receiver sử dụng để kiểm soát traffic nhận được, do buffer của receiver là hữu
hạn.
- Reducing send window size giảm data rate – lượng dữ liệu được gửi đi từ phía client.
http://www.tcpipguide.com/free/t_TCPWindowSizeAdjustmentandFlowControl-2.htm
* Thiếu bước đặt lại TCP window size receiver- xem link này:
http://andydavies.me/blog/2011/11/21/increasing-the-tcp-initial-congestion-window-on-windows-
2008-server-r2/
2. Restart program.
Management
Remote servers
server
7.2.2.1 WMI
1. WMI – Windows Management Instrumentation:
https://msdn.microsoft.com/en-us/library/windows/desktop/aa384642%28v=vs.85%29.aspx
+ My experience: Là bộ các library về hệ thống. VD gọi thông tin về các thông số phần cứng – RAM CHIP
CPU memory, người dùng sẽ gọi qua các class, các parameters ở WMI.
+ Chứa Windows Driver Model mà cung cấp các interface cho hệ điều hành. Qua các interface này,
những công cụ được quản trị sẽ cung cấp information và notification.
2. Điều kiện để giám sát được các SAM applications chứa WMI components:
b. Có thể connect RPC đến remote server, thông qua các WMI query.
- Unsupported WMI in OS
- WMI sử dụng DCOM để giao tiếp với đối tượng được giám sát DCOM là 1 điều kiện trong WMI
connections. (DCOM = Distributed COM).
- WMI namespaces: account của monitor server đến server được giám sát phải có quyền access vào
namespace + sub-namespaces của server được giám sát.
- Disable UAC để tiện cho việc giám sát + không bị hỏi khi thực hiện các động tác giám sát.
g. Đối chiếu lại với cấu hình các thành phần SolarWinds SAM.
- Credential sử dụng cho remote WMI phải giống credential sử dụng cho các thành phần SAM
components.
+ Quyền admin.
+ users
+ Pass
+ domain
- Tiếp tục sửa sâu hơn với WMI scripts & WMI services:
http://www.microsoft.com/technet/scriptcenter/topics/help/wmi.mspx
http://msdn.microsoft.com/en-us/library/aa394603.aspx
- SNMP
- WMI
- ICMP
(Phân loại node theo các giao thức sử dụng để monitor này)
d. VMware requirements: ESX serverversion 3.5, 4.0, 4.1, ESXi version 5.0, vCenter version 4.0, 4.1, 5.0.
c. SNMP đã đáp ứng được OID – Object Identified (theo hãng) chưa?
+ Trực tiếp.
2. Contact points khi các thành phần của node gặp sự cố, cần escalate lên nhóm có chuyên môn cao
hơn.
Bao Viet Operation & Monitoring doc summary | Nguyen Huynh Son