Alarm Management – the strategy and process of striving for a well-managed operation

Chris Bamber, Yokogawa Middle East & Africa B.S.C.(c)

Introduction

Maintaining a safe and stable plant is the objective of everyone involved in the manufacturing process. As Peter Drucker once said, "A well-managed plant is silent and boring," but it actually takes a lot of work and effort to ensure this is the case.

Alarm management in the plant is not just another project that gets executed, but it is a philosophy, a way of life just like safety. We don't ever enter the process area without wearing PPE, so why work in an environment where there is no strategy for alarm handling? The alarm management system is one of the most important aspects of the plant and, like everything else, it must be maintained to meet the ever-changing needs of the plant.

In the early days of control systems, before the Distributed Control System (DCS) became commonplace, configuration of alarms used to be done through mechanical means with annunciators, light boxes, etc. Now with the advent of the DCS, the cost of making extra alarms available has significantly reduced as it can be mostly done by software. However, the operator still becomes overwhelmed with unnecessary alarms if the control system design is not approached correctly.

To fully understand the purpose of the alarm management system, we must look at the basic meaning of what an alarm actually is.

  • Anything that requires an operator to take an action to maintain safety and integrity of the process
  • An alarm is designed to prevent or mitigate process upsets and disturbances

Most alarm problems exist because the above criteria are not met. Understanding this definition is key to implementing a successful alarm management system. Alarm rationalization is a process of optimizing the alarm system for safe operation by reducing the number of alarms, reviewing their priority, and validating their alarm limits. By undertaking such steps, we help reduce the workload of the operators and promote a safer working environment within the plant, and when a plant upset does occur, more visibility is available on the alarms that really matter.

As highlighted previously, alarm management is not just a project that has a start and end date; it's a continuous cycle. Once the alarm system has been reviewed and improvements have been identified, we must check that controls are in place to ensure the alarm system remains functional. The key  is to ensure that the system is continuously monitored and any changes are fully documented. It is essential that any initiatives regarding alarm management have management support available, otherwise little improvement will be made in reducing the alarm counts and improving overall safety and improvement in the process.

Alarm Management

 

Seven Key Steps for Alarm Management

There are seven key steps for alarm management. Rationalization is one of those critical steps. 

  1. Alarm Philosophy Creation
    The alarm philosophy document is critical and, without it, there can be no way to implement a successful alarm management system. This document forms the basis of the overall design guidelines and will record all the expected KPIs that will be used to measure the success of the alarm management system.  The alarm philosophy should also cover the design of the interface to the operator so the graphics are clear and upsets are easy to spot etc.
  2. Alarm Performance Benchmarking
    To measure the success of any alarm management system, we must know how big the alarm problem is that is currently being experienced. How many alarms are being generated per day, how many alarms does the operator handle on an hourly basis, what are the deficiencies we currently have in the control system? These are all valid questions and benchmarking is the starting point.  Perhaps even performing a HAZOP-like study at this stage would be advantageous.
  3. Bad Actors Resolution
    Most alarms in the control system come from relatively few sources, and checking these and fixing them will make a big difference to the overall alarm count. Reviewing the Top-10 list helps to keeps it under control. Yokogawa's Exaquantum/ARA software can provide this list on a daily basis by email or, by using Yokogawa's Exaplog alarm/event analysis tool, we can manually extract the bad actors.
  4. Documentation/Rationalization
    The most important step of the alarm rationalization process is to ensure that each change is documented and the alarm changes comply with the alarm philosophy. Alarms can be eliminated completely by re-engineering in the DCS or adopting suppression techniques.  
  5. Audit/EnforcementAlarm Management Steps
    Once the rationalization is done, the hard work is not over! Without proper change management controls in place the alarm system will slip back into its old ways. Consider adopting a Management of Change (MOC) approach to the alarm system to ensure all changes are tacked. Exaquantum/AMD can also help by identifying changes to the alarm settings and, if required, the optimal settings can be enforced automatically.
  6. Real Time Alarm Management
    For day-to-day operations, we should adopt alarm management techniques that will support rather than hinder the operator by providing Alarm Shelving, state based alarming or other alarm suppression technologies.
  7. Control & Maintain Performance
    Continued compliance to the alarm philosophy is crucial by continuously monitoring the alarm KPIs and making any required changes through a MOC type procedure. Nominate an "alarm champion" that will oversee and manage day-to-day issues. Remember that alarm management is not a one step process.

 

Alarm Rationalization: Finding the Bad Actors

Before Alarm Rationalization TableA general approach of alarm management and the steps required to implement a successful alarm management strategy was addressed in Part 1. Now, we explore the concept of alarm rationalization. As discussed earlier, the best starting point is to look at how big of an alarm problem we actually have. We can also use this as a baseline to track progress for the future. The first item to address is our "bad actors." That is the alarms that are causing the most issues within the process. Eliminating the top ten of these alarms will make a big improvement in the overall alarm count in a short period of time.  The bad actors can be obtained easily by using Yokogawa's alarm/event analysis software tool, Exaplog, or its alarm reporting and analysis software, ExaquantumARA. These tools should be run and the results reviewed on a regular basis.  In Exaplog, a report can be manually run when needed, and in ARA, a report can be generated automatically and sent via email.  The bad actor list in the table on the left is an example of a plant before alarm rationalization was started.

The alarm counts for the first three tags in this list were exceptionally high and were all found to be caused by an input open (IOP) error, which in most cases is related to a communication issue in the field, a hardware issue with the transmitter itself, or possibly an incorrect alarm threshold setting.

In this case, all of the concerned transmitters were connected to a faulty fieldbus segment. Replacing a fieldbus component cleared the problem and suddenly there were no more alarms. This immediately made a big impact on the alarm count.

The following table can be used as a general reference for help in troubleshooting different alarm types in a Yokogawa CENTUM system.

Reference for Troubleshooting Alarms Table

Alarm by Condition

It is always best to remember that just because the alarm count is high for a particular tag, there may be a logical explanation for it, and the tag should not just be suppressed because it's a nuisance to the operators. This first stage of alarm rationalization is called "Fundamental Nuisance Alarm Reduction" (FNAR).

Running a report for the bad actors and displaying the condition is recommended, as it can be filtered for the different conditions, plant areas and even down to an individual unit.

Alarm by Condition

After looking at the bad actors we can also look at the "chattering alarms." The EEMUA#191 alarm standard specifies that a chattering alarm is a tag that goes into alarm and normal again more than five times in a 60-second period. In most cases, these chattering alarms could be caused by incorrect alarm limits.  As part of the rationalization, the chattering alarms should be looked at closely and the limits reviewed accordingly.

Familiarization with the EEMUA#191 guideline and the ISA18.2 standard are important to understanding alarm rationalization, alarm management and the key performance indicators. The EEMUA#191 guideline is a detailed specification of alarm management and goes down to the detail of providing guidance of how DCS mimic displays should look and what type of furniture to use in the control room to make the operators more comfortable during their shifts. All Yokogawa alarm management based products were initially based on the EEMUA#191 guideline and are being applied to the ISA18.2 standard.  In the ideal world, EEMUA#191 recommends no more than one alarm per operator every 10 minutes. That would be  quite an achievement and is a rare occurrence. A big difference can be made the bad actors list; to identify them, and eliminate them. Making the review of the bad actors list part of the daily activities is a work process well worth the effort. Otherwise, your effort will be wasted and soon those alarms will be coming back again!

업종

  • 석유화학

    석유화학 업종 고객사의 요구는 매우 다양합니다. 경쟁이 치열한 오늘날의 시장에서 앞서 나간다면, 생산자는 품질과 생산성을 향상시키기 위해 노력하고 있습니다. Yokogawa는 이 분야에서의 오랜 기간의 광범위한 경험을 바탕으로 이러한 요구에 맞는 맞춤 솔루션을 제공합니다.

    See More
  • 업스트림

    업스트림(Upstream) 산업에는 유전 또는 해저의 원유 및 천연가스의 채취 및 생산을 위한 유정제어, 증류, 분리 및 제품 완성을 포함한 해상 및 육상 플랜트가 포함됩니다.

    석유는 육상으로 옮겨져야 하는 관계로 운송 전에 분리 작업이 필요합니다. 1차 및 2차 분리 단계는 일반적으로 가스 흐름, 물 흐름 및 오일 흐름의 3단계로 분류됩니다. 가스 이동은 파이프라인을 필요로 하며, 이동하기 전에 상류 공정에서 분류 공정을 거치게 됩니다. 액체는 탱크 또는 파이프라인에 넣고 운송을 하므로 정확한 레벨 측정이 가능한 레벨계가 필요합니다.

    See More
  • 오일 및 가스

    Yokogawa는 해상 및 육상 시설에서 파이프라인, 터미널 및 심해 운전에 이르기까지 석유 및 가스 사업의 모든 부분에서 풍부한 경험을 보유하고 있습니다. 우리는 안전을 강화하고 정확하고 신뢰성 있는 운전을 보장하며 플랜트 효율을 높이는 솔루션을 제공합니다.

    See More
  • 오일 및 가스관련 다운스트림

    석유 및 가스 산업은 최근 몇 년간 어려움이 커지고 있습니다. 여기에는 처리할 원료의 변화하는 특성, 공정 설비 및 장비의 고령화, 에너지 비용의 상승, 정유 공장을 안전하고 효율적으로 운영할 수 있는 숙련 된 플랜트 운영자의 부족, 그리고 시장과 시장의 끊임없이 변화하는 요구 사항이 포함됩니다.

    지난 수년간 Yokogawa와는 많은 어려움을 겪고 있는 산업 솔루션을 제공하기 위해 여러 다운스트림 회사와 파트너 관계를 맺어 왔습니다. Yokogawa의 VigilantPlant 솔루션은 플랜트 소유자가 플랜트 내에서 최대한의 수익성과 지속 가능한 안전을 달성하도록 도왔습니다.

    See More
  • 정유

    끊임없이 변화하는 시장에서 정유설비는 원유 처리 장치뿐만 아니라 이익센터로도 인식됩니다. 동시에 그러한 시설에서 안전의 필요성에 대한 각별한 인식이 있습니다. 계획, 스케줄링, 관리 및 제어를 포함하는 총 생산 솔루션은 수익성, 효율성 및 환경 보호를 위한 장기 목표를 달성하는 데 필요합니다. Yokogawa는 자동화 분야에서 수년간 축적 된 전문성을 바탕으로 보다 향상된 작업성 및 보다 깨끗한 세상을위한 효율적인 솔루션을 제공합니다.

    See More
  • 파이프라인

    정확한 파이프라인 제어 및 계측은 성능 및 수익성 측면에서 큰 차이를 만들 수 있습니다. Yokogawa는 압축기, 펌프, 밸브 및 중간 저장 및 배급 시설을 포함한 파이프라인 솔루션의 모든 요소의 성능을 최적화할 수 있는 전용 기술을 보유하고 있습니다.

    See More
  • 해상플랜트 (FPSO FLNG & FSRU)

    해상 탐사 및 생산에는 열악한 조건 아래 최대의 가동 시간이 요구됩니다. 유인 및 무인 시설에서는 신뢰성이 확보된 원격 모니터링 기능을 갖춘 안정적인 통합제어 및 안전시스템 (ICSS)이 필요합니다. Yokogawa는 모든 규모 및 복잡한 자동화 단계의 해양프로젝트를 수행하는 데 있어 최첨단 기술과 광범위한 경험을 보유하고 있습니다.

    See More
  • 화학

    화학 플랜트는 연속 및 Batch 생산 공정에 의존하며, 각각은 제어 시스템에 대한 다양한 요구 사항을 제시합니다. 연속 공정은 실패하지 않고 생산 라인을 중단시키는 견고하고 안정적인 제어 시스템을 필요로하는 반면, Batch 공정의 중요성은 수식, 절차 및 공정을 조정하는 데 있어 큰 유연성을 허용하는 제어 시스템을 갖추는 데 있습니다. 두 종류의 시스템 모두 제품의 사용 가능한 품질 내역에서 관리되어야 하며 비일상적인 작업을 수행할 수 있어야 합니다. Yokogawa는 광범위한 제품 포트폴리오, 숙련된 시스템 엔지니어 및 글로벌 영업 및 서비스 네트워크를 통해 모든 공장 공정에 대한 솔루션을 제공합니다.

    See More

Related Products & Solutions

  • Alarm Analysis (Exaplog)

    새로운 Exaplog Event Analysis Package를 사용하면 DCS 이벤트 로그의 문제를 정량적으로 분석할 수 있습니다. 알람 설정 조정 및 작업 순서 조정으로 번갈아 분석함으로써 운영 효율성을 지속적으로 향상시킬 수 있습니다.

    See More
  • Alarm Master Database (Exaquantum/AMD)

    ANSI/ISA-18.2-2009 및 EEMUA 191에 기반한 AMD는 관리자 및 감독자가 알람 설정 및 합리화 프로그램의 일환으로 알람 설정값의 동작을 모니터링, 평가 및 감사하는 것을 지원합니다.

    See More
  • Alarm Rationalization

    효과적인 알람 관리를 통해 운전 상태를 명확하게 파악하여 불필요한 플랜트 가동 중단으로 이어질 수 있는 취약점을 사전에 해결할 수 있습니다.

    See More
  • Alarm Reporting and Analytics (Exaquantum/ARA)

    플랜트 운전원은 종종 수많은 알람 및 비정상적인 상황에 직면하게 되므로 안전 관련 사건, 환경 문제, 가동 중단 및 장비 손상을 방지할 만큼 신속하게 대응할 수 없습니다. 과도한 알람 및 이벤트를 초래하는 잘못 적용된 알람 관리 정책은 또한 과도한 양의 정보가 수신되어 운전원이 일상적으로 알람을 무시하도록 만들 수 있습니다.

    See More
  • Alarm Management

    잘 관리된 알람 시스템을 통해 플랜트 운전의 안전성을 높이는 데 도움이 되는 소프트웨어 솔루션입니다.

    See More

Top