4 네트워크 성능을 개선 하는 단계 | NETSCOUT
백서
| 백서 |

4 네트워크 성능을 개선 하는 단계

소개
IT 네트워크는 대부분의 기업의 중심에 있어, 사업에 긴요한 어플리케이션을 지원하고, 사업 결정의 기반이 되는 데이터를 제공하며, 고객, 파트너, 공급자 및 협력자와의 커뮤니케이션을 촉진합니다. 그 어느 때 보다도, 그것은 사업에 필요한 전략적인 자산이고, 네트워크 또는 어플리케이션 성능에 있어서의 일체의 가동 중단 시간 또는 저하는 조직의 핵심에 영향을 줍니다. 비즈니스와 계약된 서비스 레벨을 전달하려면, 두 가지 도전 과제가 있습니다: 네트워크가 사용자가 필요로 하는 것을 전달하도록 하기 위하여 선행적으로 성능을 개선하고 최적화하며, 발생하는 일체의 문제를 가능한한 빨리 해결하여 가동 중단 시간을 극소화하는 것입니다. 본 백서는 네트워크와 어플리케이션 성능 문제를 해결하는 방법론을 살펴보고 근본 원인에 더 빨리 도달하는 새로운 접근방법을 개설합니다.

소개

오늘날의 기업 네트워크에서 네트워크 및 어플리케이션 문제의 근본 원인을 찾는 것은 점점 더 어렵고 시간이 오래 걸리는 일이 되었습니다. 가상화는 데이터 센터에서 데스크탑으로 확장되고 있고, 클라우드 서비스는 인기리에 성장하고 있으며, BYOD(자신의 장치를 가져 오시오)는 여기 머물러 있어서, 작업 패턴 및 문화적인 변화의 이동을 반영합니다.

문제는 Wi-Fi 장치의 급증, 무단 어플리케이션, 구성 오류, 좋지 않은 어플리케이션 전달 인프라 또는 여러 다른 소스에 의한 과도한 대역폭 사용으로 인해 발생할 수 있습니다. 음성 및 동영상의 함유 증가는 복잡성을 더욱 가중하며 대역폭을 한계 상황으로 밀고 갑니다.

성능 문제 해결은 특히 모든 그룹이 녹색 KPI를 보고하고 있는 경우, 누구의 책임인지 확인하는 도전이 더 어렵고 시간이 오래 걸리는 일이 되었습니다.


네트워크 성능 문제와 씨름하는 절차


네트워크 성능 문제의 근본 원인을 찾으려면, 다음의 4 단계 문제 해결 프로세스를 따릅니다:

그림 1: 문제 해결 워크플로.



문제 해결을 돕기 위해 사용할 수 있는 도구는 두 가지 범주입니다: 네트워크 관리 시스템(NMS) 및 패킷 캡처 및 분석 도구.

NMS의 주 역할은 모니터/경고 단계이며, 회사의 라우터 및 서버를 모니터링하고 정상 작동 및 예상 응답 여부를 확인합니다. 하지만, 일부 MNS는 너무 복잡해서 계층 3 아래의 기기만을 관리할 수 있도록 설치되어 있으며, 따라서 스위치는 계층 2에서는 모니터되지 않습니다. 폴링 데이터는 수 분 동안 합산되며 주름이 펴지기 때문에, 사용량 급증의 영향을 보여주지 않습니다. 이뿐 아니라, NMS는 중앙 집중식으로 위치해 있어, 최종 사용자 반응 시간을 이해하려는 의도로 만들어진 측정치는 부정확하며, 이는 조사 시 기기에 접촉하는 네트워크의 서로 다른 부분에서 테스트가 이루어 지기 때문입니다.

네트워크 엔지니어가 문제 해결 과정을 진행 중일 때, NMS의 유용성은 감소하며 성능 문제를 완벽하게 조사하는데 필요한 자세한 정보를 제공하지 못하게 됩니다.


3,000명의 네트워크 전문가에 대한 NETSCOUT®의 최근 설문조사에서, 응답자의 82%는 네트워크와 어플리케이션 성능을 우려사항 또는 긴요한 문제점으로 평가하며, 52%는 NMS가, 대부분 또는 모든 경우에, 근본 원인을 찾는 기능이 불충분하다고 밝혔습니다. 응답자의 51%는 일부 또는 대부분의 시간에 문제를 해결하기 위해 자리를 떠야 했다고 말했습니다.

더욱 자세한 정보를 얻기 위해, 엔지니어는 프리웨어 또는 상업적 패킷 캡처 및 분석 도구로의 전환이 필요했습니다. 이들은 네트워크의 단일 지점만을 보기 때문에 경고 단계의 제한된 역할만 하므로, 근본 원인 분석 단계는 직접 수행해야 합니다. 패킷 분석 도구의 복잡성 때문에 숙련되고 경험 많은 엔지니어가 필요하며, 시간 소모적인 사용을 초래하는데, 이는 결과적으로 너무 많은 데이터, 즉 수 백만 패킷의 검사가 필요하며 다양한 사용자 인터페이스를 통한 구축이 요구됩니다. 이것은 문제 해결 과정을 훨씬 더 어렵고 시간이 오래 걸리게 만듭니다.


네트워크에서 문제들이 숨어 있는 곳


이러한 도구들의 격차 - 포괄적인 정보와 복잡한 패킷 캡처 도구가 없는 NMS - MTTR을 증가 시킵니다. 성가시고 간헐적인 문제들이 네트워크에 '숨을' 수 있으며, IT 부서의 생산성 및 신뢰성을 감소 시킵니다.

성능 문제를 신속하게 조사하고 해결하기 위해서, 엔지니어는 네트워크에 걸친 엔드-투-엔드 가시성이 필요합니다: 기존 NMS와 패킷 캡처 사이의 격차를 채우는 자동화된 네트워크 및 어플리케이션 분석 전용 솔루션.

해결 필요성:
  • 관리 되지 않는 장비는 저렴하기 때문에 구입할 수도 있지만, 각 네트워크 세그먼트의 상태 가시성이 없고 사용률 수준을 모니터링할 수 없으므로 문제가 발생하면 문제 해결에 더 많은 비용이 듭니다. 반면, 관리 되는 스위치를 사용하면 네트워크 엔지니어는 어떤 스위치 포트에든 가서 무슨 오류인지 보고, 사용률 및 누가 해당 포트에 연결되어 있는지를 볼 수 있습니다.
  • 문서화 되지 않은 네트워크, 지속적인 문제이며, 네트워크에 자주 변경이 있는 경우 문서 작성 후 오래지 않아 구식이 되어 버립니다. 물리적으로 경로를 추적하는 것은 시간이 오래 걸릴 것이지만, 정확한 문서 없이 엔지니어는 어떤 패킷이 어디로 흐르는지도 알 수 없습니다. 필요한 것은 네트워크를 통한 실시간 경로를 발견하는 수단입니다.
  • 너무 많은 데이터, 문제는 단지 몇몇 패킷에 있을 수 있습니다. 문제 해결은 불량한 것을 찾기 위해 캡처된 패킷을 자동으로 이동하는 방법을 사용하면 훨씬 빠릅니다 - 하향식 접근법을 사용하는 어플리케이션 중심 분석.
  • 과거의 문제들, 발생 후 수 시간이 지나서야 엔지니어의 관심을 끕니다. 간헐적인 문제를 잡기 위해 필요한 것은 과거로 돌아가서 연장된 기간 동안, 예를 들어 24 시간, 많은 양의 세분화된 데이터를 캡처하고 분석하는 수단입니다.
  • 모니터링되지 않는 신 기술, 10Gb 이더넷 또는 802.11n Wi-Fi. 용량을 상당히 증가시키면 모든 문제를 극복할 것이라고 믿기 때문에 대부분의 조직은 이러한 기술용 계측 장비에 투자하지 않습니다.
  • 무선 장치 - 엔지니어는 BYOD를 포함한 Wi-Fi 장치를 식별하고 모니터링 하며, 블루투스 장치, 무선 전화기, 전자 레인지 등과의 Wi-Fi 및 비 Wi-Fi 간섭을 스펙트럼 분석을 통해 식별하는 방법이 필요합니다.
  • 네트워크 외부에 있는 문제, 엔지니어가 식별하고 추가 조사 및 신속한 솔루션을 위한 충분한 정보와 함께 성능 문제 및 지원 증거를 다른 IT 팀이나 외부 서비스 공급자에게 줄 수 있도록.

문제 해결을 위한 새로운 접근

필요한 것은 네트워크의 모든 데이터를 캡처하고 엔지니어가 근본 원인을 더 신속하게 격리 또는 실제 문제가 네트워크 외부에 있을 경우 식별할 수 있도록 지능형 분석을 제공하는 전체적인 네트워크 및 어플리케이션 성능 솔루션입니다. 흐름, SNMP 데이터 및 최대 1 밀리초 단위로 다른 장치에서 수집한 모든 정보를 수집, 집계, 연결 및 중재해야 합니다. 가이드된 워크플로를 적용하여 문제의 근본 원인을 신속하게 분리할 수 있도록 단일 사용자가 구성 가능한 대시보드를 통해 데이터를 표시 합니다. 가정을 만들 필요를 제거하고 문제를 식별하고 해결될 때까지 사용자가 논리 프로세스를 따를 수 있도록 함으로써, MTTR을 줄이고 네트워크 엔지니어는 더 효율적이 됩니다.

네트워크 및 어플리케이션 성능 솔루션은 문제 해결 과정의 모든 단계를 용이하게 하고 네트워크 최적화를 지원하는데 필요한 가시성을 제공합니다.


1 단계: 모니터/경고

네트워크 문제 조치 및 해결 시 첫 번째 요구 사항은 문제가 발생한 적시에 경고를 제공하는 시스템입니다. 최악의 경우는 사용자의 전화를 받고 밖으로 찾아 나서는 경우인데, 엔지니어는 이미 뒷북입니다. 많은 네트워크 관리 도구는 경고 시스템이 핑 하거나 각 브로드캐스트 도메인에 있는 모든 장치를 발견하도록 각 네트워크에 대해 수동으로 구성해야 합니다. 그러나 항상 가동하는 네트워크 및 어플리케이션 성능 솔루션을 사용하면, 자동 발견 및 가이드된 워크플를 통해 신속하고 쉽게 연결된 것들을 즉시 볼 수 있습니다. 이것은 설정 및 모니터링에 필요한 시간을 상당히 줄일 수 있습니다.

성능 데이터는 지속적으로 수집되고 데이터베이스에 저장되며 사용자가 자신의 요구 사항에 맞게 구성할 수 있는 성능 대시보드에서 GUI를 통해 표시됩니다. 사용자 정의 기준(예: SLA)에 대해 성능이 모니터링되고 범위를 벗어나는 모든 것이 즉시 경보 표시됩니다. 사용자는 조사 단계 시작 부터 다양한 각도에서 문제를 볼 수 있습니다.

네트워크 및 어플리케이션 성능 시스템은 또한 HP OpenView 또는 Tivoli Netcool과 같은 기존 네트워크 관리 시스템과 통합될 수 있으며, 서비스 관리 및 운영 대시보드 솔루션에 정보 및 경보를 전달합니다.


2 단계: 조사

네트워크 엔지니어는 이제 문제의 범위를 조사해야 합니다. 신속하고 정확한 조사를 촉진하기 위해, 솔루션은 SNMP, 흐름, 패킷, 최종 사용자 응답 시간 등의 모든 관련 데이터를 수집, 저장하고, 미래 분석을 위해 저장합니다. 네트워크 및 어플리케이션 성능 솔루션은 또한 클라이언트에서 서비스 또는 어플리케이션 까지 경로 발견의 실시간 메서드를 제공해서 소요시간을 상당히 줄입니다; 다음 두 장치 사이의 경로를 발견하고 내부 및 외부 네트워크, 경로에 있는 장치의 모든 문제를 모니터링 합니다. 결과는 이해 및 신속한 근본 원인 분석을 촉진하기 위해 그래픽 형식으로 표시됩니다.

최적의 효과를 위해 시스템은 인터페이스에 10Gbps 및 1Gbps 연결을 제공해야 하고, 선로의 회선 속도로 데이터를 캡처할 수 있어야 합니다. 일부 솔루션은 경로에 있는 계층 2 및 계층 3 장치를 식별하고 문제의 소스를 식별하는데 필요한 세분성을 제공함으로써 클라이언트에서 서버까지의 네트워크를 통해 경로를 추적할 수 있습니다.

문제가 클라이언트 또는 클라이언트 그룹에 있는 경우, 엔지니어는 문제가 유선 또는 무선 네트워크 문제인지 식별하기 위해 성능 또는 어플리케이션 응답 테스트를 수행해야 합니다. 내장된 유선 및 무선 도구를 제공하여 동일한 사용자 인터페이스를 사용함으로써, 네트워크 및 어플리케이션 시스템은 한 번의 테스트로 문제의 소스 식별을 가능하게 합니다.

악성코드 대량 발생 또한 이 과정의 일부를 통해 식별되며, 원래 IP 주소를 포함해서 다른 도구가 놓치는 가동 중단 시간의 근본 원인을 식별하도록 엔지니어를 도와줍니다.


3 단계: 격리

이 단계에서 문제는 단일 네트워크 세그먼트, 스위치, 라우터, 서버 또는 어플리케이션 및 경로, 장치 및 식별된 경로의 포트로 격리됩니다. 이제 경로가 분석되어야 하며, 문제의 원인이 결함이 있는 장치, 링크 미디어, 소음 또는 간섭, 또는 트래픽 과부하인지 확인하기 위해 각 링크에 대한 트래픽 통계가 필요합니다.

SNMP(단순 네트워크 관리 프로토콜)의 큰 장점 중 하나는 오류 도메인을 격리하는 기능입니다. SNMP를 사용해서 길을 따라 각 연결 지점을 쿼리하면 트래픽 병목 침체가 속도 저하의 소스인지를 결정할 수 있습니다. 이것은 경로의 장치가 관리되고 엔지니어가 장치에서 정보를 얻기 위한 암호 또는 커뮤니티 문자열을 가지고 있는 경우 간단합니다. 그렇지 않은 경우 패킷 및 트래픽 통계를 보기 위해 네트워크를 중단하지 않고 각 링크에 도구를 연결해야 합니다. 큰 지리적 지역에 걸쳐 많은 링크가 있을 경우 시간이 매우 오래 걸릴 수 있으며, 다른 위치에서 여러 도구가 필요할 수도 있습니다.

네트워크 및 어플리케이션 성능 도구를 사용해서 자동으로 네트워크 인프라의 상태를 확인하면 SNMP 지원 장치를 모두 모니터링 해서, 라우터에 SNMP MIB를 쿼리하고 정기적으로 다시 보고하여 패킷 손실이나 높은 사용률을 보여주는 어플리케이션 흐름을 찾는 것이 가능합니다. 네트워크에 수십 또는 수백 개의 스위치가 있더라도, 과정은 간단하고 신속합니다.

문제가 발생한 지점에서만 표시되므로써, 일부 문제만 표시됩니다. 이는 클라이언트 또는 데이터 센터의 10G 링크 앞인지 상관 없이 문제 지점에 연결하기 위한 올바른 테스트 기능 및 올바른 인터페이스를 가진 휴대용 장치를 요구합니다. 많은 사람들이 원격으로 일하므로, 이러한 가시성을 제공하는 도구를 갖는 것은 필수적입니다 - BYOD가 성장함에 따라 중요성은 증가되고 있습니다.

휴대용 도구는 또한 네트워크상의 관리되지 않는 장비에서 어떤 일이 일어나고 있는지 보기 위해 동반 엔지니어가 필요 없이 원격 사이트로 발송할 수 있습니다. 이상적으로 경로 분석, 어플리케이션 인프라 상태 및 어플리케이션 흐름을 측정하고 로밍 검토 뿐만 아니라 무선랜 성능 분석 기능과 재시도 기능, 외부 장치로부터의 모든 간섭을 조사하는 능력을 가지고 있어야 합니다.

만약 과도하게 예약되거나 또는 프레임 오류가 있는 링크가 없다면, 문제는 네트워크가 아닐 수도 있습니다 - 하지만 이는 엔지니어가 적절한 시간 동안 링크를 분석했고 해결하려는 문제가 여전히 존재하는 경우에만 확인됩니다. 이는 네트워크 및 어플리케이션 성능 시스템에서 캡처한 역사적인 데이터를 필요로 합니다.


4 단계: 근본 원인 분석 및 해결

이 단계에서 엔지니어는 문제의 원인을 확인, 공식화 하고 수리를 구현하며 솔루션의 유효성을 검사합니다. 문제가 네트워크에 위치하지 않고 서버 응답 또는 리소스 과부하의 결과가 아닌 경우, 패킷을 캡처하고 분석하는 자세한 정보가 필요합니다. 패킷 분석은 매우 시간이 오래 걸리고 상당한 기술과 경험을 요구하므로 서버, 네트워크 및 어플리케이션 간의 문제를 먼저 격리하고 선별하는 것이 중요합니다.

근본 원인을 좀 더 신속하게 찾으려면, 어플리케이션 레벨에서 시작하는 하향식 접근이 좋습니다. 예를 들어, 경로는 양호하지만 응답 시간이 안좋은 경우, 문제는 가상화된 서버, 여러 계층에서 실행 중인 어플리케이션 또는 어플리케이션 버그일 수 있습니다.

한가지 옵션은 어플리케이션 레벨 및 패킷 사다리 다이어그램을 쉽게 보여주는 패킷 분석기를 사용하는 것입니다. 스팬 또는 미러된 탭 연결은 구성하기 쉽지만 무거운 트래픽 로드를 가진 패킷을 잃을 수 있으며 스팬을 제공하는 계층 2 스위치에 의해 차단되므로 계층 1 오류가 표시되지 않을 수 있습니다. 수동 탭이 최선이지만 그들을 연결하는 것은 이 링크가 제공하는 서비스의 중단을 초래합니다. 성능이 문제인 경우, 일반적으로 문제를 일으키지는 않지만 이 링크를 사용하여 다른 서비스에 연결하는 것에 영향을 미칠 수 있습니다.

더 나은 솔루션은 서버 팜, 데이터 센터, 외부 링크로 가는 라우터 앞, 네트워크의 핵심의 전략적 위치에 탭을 미리 배치하는 네트워크를 구성하는 것입니다. 이를 통해 네트워크를 부수지 않고 캡처할 수 있습니다. 만약 이것이 가능하지 않다면 엔지니어는 동반되는 문제와 부정확성을 감수하면서 스팬 또는 포트 미러링을 다시 배열해야 합니다.

네트워크 및 어플리케이션 성능 솔루션은 캡처된 패킷을 통해 나쁜 것들을 찾는 선별의 자동화된 방법을 제공합니다. 문제를 나타내는 시각적 표시기와 함께 각 데이터 흐름을 보여 주는 GUI를 가진 어플리케이션 중심 접근 방식을 사용합니다. 엔지니어는 단순히 이를 클릭해서 정확하게 어떤 패킷 또는 패킷들이 문제인지 찾을 수 있습니다. 인프라 여러 지점에서 패킷을 캡처함으로써 어디에 문제가 있는지 확인 하는데 더 자세한 도움을 줄 수도 있습니다. 다중 세그먼트 분석, 동시에 여러 지점에서 데이터 캡처를 실행하고 전체 그림을 제공하는 결과 병합의 수행 능력이 필요합니다.

효과적인 근본 원인 분석은 데이터 센터 또는 서버 또는 원격 사이트에서 수행하여 문제가 서버 또는 어플리케이션 관련인지 볼 수 있습니다. 일부 도구는 성능 및 리소스 문제를 밝히기 위해 실제 또는 가상 서버에서 관리 정보를 가져올 수 있습니다.

역사적인 세부 데이터를 수집, 분석함으로써, 네트워크 및 어플리케이션 성능 시스템은 또한 엔지니어가 문제가 처음 나타났을 때 시간을 되돌아 가서 증상을 검토할 수 있게 하며, 간헐적인 문제를 식별하고 해결할 수 있게 해줍니다.


네트워크 최적화

네트워크 어플리케이션 및 성능 솔루션은 엔지니어가 기업 네트워크의 상태를 기록하고 감사하는데 필요한 가시성을 제공합니다. 성능 저하를 찾아 내고 어플리케이션 또는 서버 경로가 느린 곳을 식별해서, 가장 느리고 가장 중요한 경로 문제가 해결되도록 합니다. 얻은 정보는 서버 업그레이드와 같은 우선 순위 프로젝트에 사용될 수 있고 승인을 위한 비즈니스 사례를 만듭니다. 또한 어떤 조치가 실제 작동했는지 그리고 다른 곳에 부정적인 영향은 없는지를 확인함으로써 새로운 장비와 어플리케이션의 설치를 지원할 수 있습니다. 데이터는 또한 가상화, WAN 최적화 또는 데이터센터 통합과 같은 네트워크 변화의 영향을 증명(또는 부정)할 수 있습니다.



NETSCOUT에 대하여

NETSCOUT SYSTEMS, INC. (NASDAQ: NTCT)은 오늘날의 가장 까다로운 서비스 제공업체, 기업 및 정부 네트워크에 대한 실시간 서비스 보증 및 사이버 보안 솔루션 시장의 선두 주자입니다. NETSCOUT의 적응형 서비스 인텔리전스(ASI) 기술은 서비스 전달 환경을 지속적으로 모니터하여 성능 문제를 식별하고 네트워크 기반 보안 위협에 대한 통찰적 정보를 제공하여, 팀원들이 사업 중단을 야기하거나 사용자 경험에 영향을 미칠 수 있는 문제들을 신속하게 해결하는 데 도움을 줍니다. NETSCOUT는 최고의 서비스 가시성을 제공하고, 우리의 연결된 세계를 지원하는 디지털 인프라를 보호합니다.
 
 
Powered By OneLink