Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

MCCS  uses 4 TCP ports for heartbeat connection. Default values are 14321,1 4322, 14323, 14324 and ICMP Echo Request

노드 상태 확인

MCCS는 원격 노드의 장애를 결정할 때 핫빗 연결 상태를 참조합니다.  원격 노드와의 모든 핫빗 연결이 단절되면 해당 노드를 장애로 결정합니다.  따라서 핫빗 네트워크의 장애는 노드 장애로 결정될 수 있기 때문에 이중화할 필요가 있습니다. 노드 상태 확인에 대한 자세한 내용은 "MCCS  사용자 안내서의 4.노드에서 MCCS 동작 원리"를 참조해 주십시오.

노드간 명령 전달

리소스의 구성 변경 또는 리소스 및 그룹 제어와 같은 명령이 웹콘솔 또는 CLI를 통해 접수되면 MCCS는 핫빗을 통해 이 명령을 상대 노드로 전달합니다.

리소스

리소스는 MCCS에 의해서 관리되는 서비스 자원 (예를 들어 네트워크 카드, IP 주소, 디스크, 응용 프로그램 등)을 말합니다. MCCS는 리소스들의 상태를 감시하거나 서비스를 제어할 수 있습니다.  리소스는 동작 형태에 따라 네트워크 카드와 같은 감시 전용 리소스와 프로세스와 같은 시작/종료형 리소스가 있으며, 감시 전용 리소스는 상태 감지만 가능하며, 시작/종료 기능은 수행하지 않습니다.

리소스 타입

MCCS에서 지원하는 리소스는 다음과 같이 분류됩니다.

네트워크카드

MCCS 는 TCP/IP  기반 네트워크 연결을 모니터 합니다. 일시적인 연결 장애나 네트워크 어댑터, 케이블의 네트워크에 장애를 감지합니다.

네트워크주소

MCCS 는 전환가능한 노드안의 네트워크 장치 위에서 가상 IP 주소와 서브넷 마스크를 구성하고 가상 IP 주소를 감시하며 노드의 실제 IP 주소와 같은 방식으로 동작합니다. 가상 IP 주소를 할당할 네트워크 카드의 실제 IP 주소는 정적이어야 합니다.

기본 응용

단일 실행 파일 형태의 프로세스를 등록할 때 사용하며, MCCS는 운영 체제의 프로세스 테이블에 등록된 프로세스 이름의 존재 여부를 체크해서 장애를 감지합니다.

복합 응용

기본 응용과 달리 여러 개의 프로세스로 이루어진 응용 프로그램 또는 톰캣과 같이 스크립트로 실행해야 하는 응용 프로그램 등을 등록할 때에 사용합니다. 단순히 실행 파일만을 감지하지 않고, 프로세스에 대한 시작/종료/감지 기능을 수행하는 스크립트 명령을 이용하여 사용자가 원하는 방법으로 정상적인 동작을 감시하고자 할 경우에도 복합 응용으로 등록하여 사용합니다.

공유 디스크

디스크 잠금(Lock) 기법이 적용된 MCCS의 외장 공유 디스크 제어 모듈은 항상 서비스가 운영중인(Active) 서버에 대해서만 공유 디스크의 접근을 허용합니다.

미러 디스크

외장 공유 디스크가 없는 구성 환경에서 사용하며, 별도의 복제 모듈을 이용하여 두 대의 시스템 간 로컬 디스크를 복제합니다. MCCS는 DRBD 를 복제 기능 소프트웨어로 제공하고 있습니다.

서비스

서비스는 운영체제의 서비스 매니저에 등록된 프로세스 혹은 프로세스 그룹입니다.

스카시예약

스카시예약 에이전트는 SCSI3-PR(Persistent Reservation) 이라는 스토리지가 지원하는 SAN 프로토콜을 사용하여 LUN 단위의 Lock 을 관리합니다. 이 기능은 클러스터의 모든 노드가 다른 노드의 상태를 알 수 없을 때 데이터 손상을 방지합니다.

리소스 그룹

서로 연관(의존) 관계에 있는 리소스들의 집합으로 페일오버가 이루어지는 기본 단위입니다.   예를 들어 ORACLE 서비스에 대한 페일오버 구성을 하기 위해서는 ORACLE 클라이언트가 접속하는 IP 주소, IP 주소가 할당되는 네트워크 카드, 데이터가 저장될 디스크, ORACLE 리스너와 ORACLE 서버를 하나의 리소스 그룹으로 묶어야 합니다. IP 주소는 네트워크 카드에 의존하며, ORACLE 리스너와 ORACLE 서버는 데이터가 존재하는 디스크에 의존하는 관계로 그룹을 구성해야 합니다.  IP 주소의 경우, 네트워크 카드 없이는 등록이 불가능하며, ORACLE 관련 프로세스도 데이터가 저장된 디스크 없이는 구동이 불가능하기 때문입니다. 그룹은 서비스의 페일오버 여부에 따라 병렬형과 페일오버형으로 나뉘어집니다.  병렬형과 페일오버형에 대한 설명은 "MCCS 사용자 안내서의 4.리소스 그룹"을 참조해 주십시오.

 

 

 

...

Check the state of a node

MCCS refers to heartbeat connection when determine a fault of remote node.  If all the heartbeat connection is disconnected from the remote node, it is considered as a failure.  Therefore, redundant heartbeat connection is strongly recommended  because failure on heartbeat network can result in node failure.
(Please refer to "4-Node of MCCS UserGuide" for more details about node state)

Sending command between nodes

Commands such as changing configuration of resource or control resource and group can be done through using Web console or CLI. MCCS uses heartbeat line to send commands to another node.

Resource

Resources are hardware and software components, such as network interface cards (NICs), IP address, applications, disk and etc managed by MCCS.
MCCS can monitor the state of resources and can control which are bring service online, take offline, enable and disable those.
There are two categories of resources in MCCS which are ‘PERSISTENT’ and ‘ON-OFF’. Most resources such as IP address, disk, process and service are ON-OFF which MCCS bring online and offline based on management policies. On the contrary, a PERSISTENT resource such as NIC cannot be brought online or taken offline by MCCS  and only monitored the status and operation.

Resource Type

Resources that managed by MCCS are classified as below.

Network Interface Card

MCCS monitor the TCP/IP based network connectivity. It detects the network unplug, ethernet adapter failure, or cable failure.

IP Address

MCCS manages virtual IP address and subnet mask which will be assigned on a NIC and switchable node to node in case it reacts in the same manner as the node's real IP address.

A real IP address which is static must be set in the NIC to add on a virtual IP address.

Process

Process is used when register single execution file. MCCS detects the failures by checking if the process name exists in the process table of operating system.

Application

It is similar to process. But this is more complicated. Application works with several application or scripts such as tomcat.

MCCS does only detect on execution file, but it also brings online/ take offline/monitor the process by using pre-defined script.

Shared Disk

Within a cluster, the application may be store the data on shared disk when it is equipped. MCCS attach the file system on shared disk to the only active server and lock to the standby server to prevent file system corruption. Control module on disk lock of shared disk only applies to the active server.

MirrorDisk

When clustered nodes does not use shared storage, the data will be stored in each of local disk or direct attache storage. In this environment, the mirroring component is needed through TCP/IP connection between nodes to synchronize the changed data.

Service

Service is process or process group registered in service manager of Linux O.S.

SCSI-LOCK

SCSI-LOCK uses SAN protocol which is called SCSI-3 PR(Persistent Reservation). This is needed to prevent any data corruption which enable only one node can access a disk volume in environment where disk volumes are shared between nodes

Resource Group

Resource group is a set of resources with dependency and MCCS failover the entire resources in a group. 

For example, to manage the ORACLE service by MCCS, IP address that is connected by client, network interface card, disks which database is stored, ORACLE listener and server service must be enclosed by a unit which is called as Group. Group should be configured as IP address dependent on network interface card, ORACLE server dependent on disk where database is stored, ORACLE listener dependent on ORACLE server to provide proper service.

IP address cannot be assigned without network interface card, process related to ORACLE can be bring online after disk completed online. If there is more than a group defined on a cluster, one group will failover without affecting the other groups.

There are two types, parallel and failover group, according to the service.

Please refer to "5-Resource Group of MCCS User Guide" for more details about parallel and failover group.