Giám sát vận hành ứng dụng/ Services ( APM )
- 28/11/2024
Giám sát hiệu suất ứng dụng hay Application Performance Monitoring (APM) là hoạt động theo dõi các chỉ số đo lường hiệu suất của ứng dụng phần mềm quan trọng bằng cách sử dụng phần mềm giám sát và dữ liệu đo từ xa. APM đảm bảo rằng các ứng dụng mà người dùng làm việc đáp ứng các tiêu chuẩn hiệu suất và cung cấp trải nghiệm người dùng mượt mà. Ứng dụng di động, trang web và ứng dụng kinh doanh là những trường hợp sử dụng điển hình để theo dõi. Tính khả dụng liên tục và hiệu suất thích hợp của một ứng dụng là điều cần thiết để một công ty có thể duy trì các quy trình kinh doanh không bị gián đoạn.
Đội ngũ IT vận hành hệ thống có thể sử dụng số liệu hiệu suất - công cụ APM thu thập từ một ứng dụng cụ thể hoặc nhiều ứng dụng trên cùng một mạng - để xác định nguyên nhân gốc rễ của sự cố. Dữ liệu mà các công cụ APM thu thập bao gồm việc sử dụng CPU của máy khách, nhu cầu bộ nhớ, thông lượng dữ liệu và mức tiêu thụ băng thông.
Giám sát hiệu suất ứng dụng hoạt động bằng cách quan sát các ứng dụng đang hoạt động như thế nào và liệu chúng có hoạt động phù hợp hay không; nếu các ứng dụng hoạt động không phù hợp, thì dữ liệu được thu thập từ nguồn của sự cố; dữ liệu thu thập được được phân tích trong bối cảnh ảnh hưởng của nó đối với hoạt động kinh doanh; và môi trường ứng dụng được sửa chữa để giải quyết mọi vấn đề tương tự trước khi chúng xảy ra.
Khi định cấu hình giải pháp APM, cần xem xét ba loại dữ liệu: số liệu (metric), dấu vết (trace) và tệp nhật ký (log)
Đội ngũ IT vận hành hệ thống có thể sử dụng số liệu hiệu suất - công cụ APM thu thập từ một ứng dụng cụ thể hoặc nhiều ứng dụng trên cùng một mạng - để xác định nguyên nhân gốc rễ của sự cố. Dữ liệu mà các công cụ APM thu thập bao gồm việc sử dụng CPU của máy khách, nhu cầu bộ nhớ, thông lượng dữ liệu và mức tiêu thụ băng thông.
Giám sát hiệu suất ứng dụng hoạt động bằng cách quan sát các ứng dụng đang hoạt động như thế nào và liệu chúng có hoạt động phù hợp hay không; nếu các ứng dụng hoạt động không phù hợp, thì dữ liệu được thu thập từ nguồn của sự cố; dữ liệu thu thập được được phân tích trong bối cảnh ảnh hưởng của nó đối với hoạt động kinh doanh; và môi trường ứng dụng được sửa chữa để giải quyết mọi vấn đề tương tự trước khi chúng xảy ra.
Khi định cấu hình giải pháp APM, cần xem xét ba loại dữ liệu: số liệu (metric), dấu vết (trace) và tệp nhật ký (log)
- Số liệu (metric): Số liệu là một thước đo được định lượng có thể được sử dụng để hiểu trạng thái của một quy trình cụ thể. Các chỉ số thường được so sánh với một đường cơ sở xác định để phân tích trạng thái của hệ thống hoặc quy trình. Các chỉ số thay đổi là một dấu hiệu phổ biến của một vấn đề cơ bản.

Một số chỉ số giám sát ứng dụng quan trọng nhất bao gồm:
- Giám sát hiệu suất web - đo thời gian phản hồi trung bình cho các tương tác của người dùng cuối để xem liệu tốc độ có ảnh hưởng đến hiệu suất ứng dụng hay không.
- Mức sử dụng CPU - giám sát mức sử dụng CPU cùng với tốc độ đọc / ghi đĩa và nhu cầu bộ nhớ để xem liệu việc sử dụng có ảnh hưởng đến hiệu suất ứng dụng hay không.
- Tính khả dụng và thời gian hoạt động của ứng dụng - đo lường xem ứng dụng có trực tuyến và có sẵn cho người dùng hay không; nó thường được sử dụng để xác định việc tuân thủ SLA của một tổ chức.
- Tỷ lệ yêu cầu - đo lượng lưu lượng mà ứng dụng nhận được để xác định bất kỳ sự gia tăng, giảm hoặc trùng hợp đáng kể nào của người dùng.
- Sự hài lòng của khách hàng - cho biết cảm nhận của khách hàng về ứng dụng so với đường cơ sở đã xác định.
- Tỷ lệ lỗi - quan sát cách ứng dụng xuống cấp hoặc lỗi ở cấp phần mềm.
- Số lượng phiên bản - đếm số lượng phiên bản máy chủ hoặc ứng dụng đang chạy cùng một lúc. Điều này đặc biệt quan trọng đối với ứng dụng đám mây
- Dấu vết (trace): là quá trình xử lý hoàn chỉnh một yêu cầu. Một dấu vết được sử dụng để minh họa và hiểu toàn bộ hành trình của một yêu cầu khi nó di chuyển qua tất cả các thành phần và dịch vụ của mạng. Một dấu vết chứa hàng trăm điểm dữ liệu có thể chỉ ra lỗi, chẩn đoán các mối đe dọa bảo mật và phát hiện và cô lập các sự cố mạng.

- Nhật ký (log): được tạo tự động bởi một ứng dụng hoặc hệ điều hành; họ nắm giữ thông tin về hành vi của người dùng và các sự kiện đã diễn ra trên ứng dụng. Các tệp nhật ký được sử dụng để thực hiện phân tích nguyên nhân gốc rễ, hiểu lý do tại sao số liệu thay đổi và xác định vị trí bắt đầu một sự kiện.

Các thành phần của APM
Giám sát hiệu suất ứng dụng tập trung vào việc theo dõi 5 thành phần chính của hiệu suất ứng dụng:
- Runtime application architecture
- Real user monitoring
- Business transactions
- Component monitoring
- Analytics and reporting
1. Runtime application architecture phân tích các thành phần phần cứng và phần mềm được sử dụng trong quá trình thực thi ứng dụng và các phần mà chúng giao tiếp với nhau. Thông qua nhận dạng mẫu và xác định các vấn đề về hiệu suất, các chuyên gia CNTT có thể dự đoán khả năng xảy ra các vấn đề trong tương lai trước khi chúng xảy ra.
2. Real user monitoring, còn được gọi là giám sát trải nghiệm người dùng cuối, thu thập dữ liệu hiệu suất dựa trên người dùng để hiểu ứng dụng đang hoạt động tốt như thế nào đối với người dùng và để đánh giá các vấn đề hiệu suất tiềm ẩn. Giám sát người dùng thực cho phép một tổ chức ứng phó hiệu quả với các lỗi và hiểu được tác động của chúng.
3. Business transactions, còn được gọi là hồ sơ giao dịch do người dùng xác định, tập trung vào việc kiểm tra các tương tác cụ thể của người dùng và tạo lại chúng để kiểm tra và hiểu các điều kiện dẫn đến sự cố về hiệu suất. Quá trình này sẽ giúp các tổ chức theo dõi các sự kiện khi chúng di chuyển qua các thành phần khác nhau của ứng dụng, cũng như tiết lộ thời gian và vị trí các sự kiện đang diễn ra - và liệu hiệu suất hoạt động có được tối ưu hóa hay không.
4. Component monitoring, đi sâu vào thành phần ứng dụng, liên quan đến việc theo dõi tất cả các thành phần của cơ sở hạ tầng CNTT. Giám sát chuyên sâu và mở rộng được thực hiện trên tất cả các tài nguyên đã sử dụng và các sự kiện có kinh nghiệm trong cơ sở hạ tầng hiệu suất ứng dụng - điều này bao gồm phân tích tất cả các máy chủ, hệ điều hành, phần mềm trung gian, thành phần ứng dụng và thành phần mạng. Giám sát thành phần cung cấp hiểu biết sâu hơn về các yếu tố và con đường khác nhau đã được xác định trong các quy trình trước đó.
5. Analytics and reporting liên quan đến việc dịch dữ liệu thu thập được từ các quy trình trên thành thông tin có thể được sử dụng để:
2. Real user monitoring, còn được gọi là giám sát trải nghiệm người dùng cuối, thu thập dữ liệu hiệu suất dựa trên người dùng để hiểu ứng dụng đang hoạt động tốt như thế nào đối với người dùng và để đánh giá các vấn đề hiệu suất tiềm ẩn. Giám sát người dùng thực cho phép một tổ chức ứng phó hiệu quả với các lỗi và hiểu được tác động của chúng.
3. Business transactions, còn được gọi là hồ sơ giao dịch do người dùng xác định, tập trung vào việc kiểm tra các tương tác cụ thể của người dùng và tạo lại chúng để kiểm tra và hiểu các điều kiện dẫn đến sự cố về hiệu suất. Quá trình này sẽ giúp các tổ chức theo dõi các sự kiện khi chúng di chuyển qua các thành phần khác nhau của ứng dụng, cũng như tiết lộ thời gian và vị trí các sự kiện đang diễn ra - và liệu hiệu suất hoạt động có được tối ưu hóa hay không.
4. Component monitoring, đi sâu vào thành phần ứng dụng, liên quan đến việc theo dõi tất cả các thành phần của cơ sở hạ tầng CNTT. Giám sát chuyên sâu và mở rộng được thực hiện trên tất cả các tài nguyên đã sử dụng và các sự kiện có kinh nghiệm trong cơ sở hạ tầng hiệu suất ứng dụng - điều này bao gồm phân tích tất cả các máy chủ, hệ điều hành, phần mềm trung gian, thành phần ứng dụng và thành phần mạng. Giám sát thành phần cung cấp hiểu biết sâu hơn về các yếu tố và con đường khác nhau đã được xác định trong các quy trình trước đó.
5. Analytics and reporting liên quan đến việc dịch dữ liệu thu thập được từ các quy trình trên thành thông tin có thể được sử dụng để:
- Xác định đường cơ sở hiệu suất bằng cách sử dụng dữ liệu lịch sử và hiện tại đặt kỳ vọng cho hiệu suất ứng dụng bình thường;
- Xác định các lĩnh vực cải tiến tiềm năng bằng cách so sánh các thay đổi về cơ sở hạ tầng với các thay đổi về hiệu suất;
- xác định, định vị và giải quyết các vấn đề về hiệu suất một cách hiệu quả bằng cách sử dụng dữ liệu lịch sử và cơ sở;
- dự đoán và giảm bớt các vấn đề tiềm ẩn trong tương lai bằng cách sử dụng

GIÁ TRỊ ĐEM LẠI
- Cung cấp bối cảnh tập trung và khả năng hiển thị về hoạt động bên trong của ứng dụng trên một hệ thống phân tán
- Cho phép bạn chủ động xác định các vấn đề có thể gây ra sự cố và giải quyết các vấn đề về độ trễ
- Giúp bạn đáp ứng kỳ vọng và nhu cầu của người dùng cuối
- Tăng doanh thu bằng cách hạn chế trường hợp downtime và tình trạng gián đoạn của người dùng
- Tiết kiệm băng thông kỹ thuật khi gỡ lỗi và xử lý sự cố



