4차 산업혁명시대에 산업 생태계가 급격히 변화하는 시점에서 빠른 연구개발(R&D) 및 사업화를 위한 제조업계의 디지털 전환은 경쟁력 향상을 넘어 생존 문제로 직결되고 있다. 이미 해외 선진국들은 컴퓨터 시뮬레이션을 통한 가상 제조기술 및 인공지능(AI)과 빅데이터 등을 활용한 오픈 플랫폼을 구축해 활용하고 있는 반면 우리나라는 데이터 축적부터 어려움을 겪고 있는 상황이다.
한국생산기술연구원에서는 5년여 동안 내·외부 전문가 학습, 단계별 기술 자체개발 및 검증을 통해 지속적으로 개선되고 있는 제조분야 인공지능 기술을 바탕으로 중소·중견기업의 제조업 인공지능 기술적용을 위한 연구를 해왔다. 본지는 이러한 연구결과를 총 10회에 걸친 연재기고를 통해 제조공정에 인공지능을 적용하기 위한 방법을 전달하고자 한다. 이를 통해 보다 많은 기업들이 쉽고 편하게 데이터 취득시스템을 개발·설치하고, 데이터 입출력 부분을 셀프 코딩하며, 송수신, 데이터 전처리 등을 거친 효과적인 인공지능 알고리즘을 통한 학습 및 검증을 통해 자사의 문제들을 풀어감으로써 제조기술 지능화에 한 발짝 다가가길 기대한다.
제조업 인공지능 적용
설계·검사·공정·물류 등, 데이터 부족 해결 위한 증강·전이학습 필요
■연재 순서
1. 제조 중소·중견기업 인공지능 기술개발
2. 제조공정 데이터 취득(DAQ) 시스템 개발
3. IoT 센서 패키지 HW/SW 개발 및 데이터 송·수신
4. 데이터 전처리
5. 제조업 인공지능 적용
6. 인공지능 데이터 및 알고리즘 유형
7. 디지털 트윈 구축 및 HW/SW 개발 적용
8. 시계열 데이터 인공지능 학습 (예)
9. 이미지 데이터 인공지능 학습 (예)
10. 뿌리 제조기업의 공정지능화 과제
■데이터의 중요성
데이터 기반의 인공지능(AI) 기술을 개발하고 실제 제조업에 적용하기 위해서는 무엇보다도 데이터 확보가 중요하다. 그럼 데이터란 무엇인가?
데이터는 인공지능이 지능적 판단을 하기 위한 근거가 되는 입력 데이터(예: 이미지, 진동, 온도, 공정 데이터 등)와 인공지능이 어떠한 판단을 내리면 좋겠다는 정답 데이터로 이루어진다. <그림 1>
입력 데이터 하나하나에 정답 데이터를 만드는 작업을 레이블링(Labeling) 이라고 한다. 이렇게 입력 데이터와 정답 데이터가 짝을 이루어 학습을 하는 방법을 지도학습(Supervised Learning)이라고 하고, 이와는 다르게 입력 데이터만 있고 정답 데이터가 없는 상황에서 학습하는 방법을 비지도학습(Unsupervised Learning)이라고 한다.
각 방법별로 학습 방법과 얻고자 하는 목표가 다르다. 일반적으로, 정답 데이터가 명확한 상황에서의 지도 학습이 원하는 성능을 얻을 수 있는 가능성이 높다. 따라서 제조업에서 인공지능 기술을 성공적으로 적용하기 위해서는 어떤 데이터를 입력으로 하고, 입력 데이터를 어떻게 획득하고 레이블링하며, 각 입력마다 인공지능이 어떠한 출력이 나오도록 하는지에 대한 정의를 명확히 하는 것이 무엇보다도 중요하다.
▲ <그림 1>주요 제조 데이터 유형
■제조 인공지능 적용 분야
인공지능의 입력과 출력을 정의하는 것이 중요하지만 풀고자 하는 제조업 현장의 문제를 인공지능 관점에서의 문제로 재정의 하는 것이 쉽지는 않다. 따라서 제조업에 인공지능 기술이 어떻게 적용되는지 사례를 분석하면 많은 도움이 될 수 있다.
제조 생산현장에 인공지능 기술을 적용하고자 하는 분야는 크게 5가지로 구분할 수 있다. 제품이 원하는 물리적 특성을 갖도록 소재를 구성하거나 색상, 모양 등을 디자인하는 설계 지능화, 제품을 생산하는 핵심 설비의 상태 진단 및 이상 감지, 생산된 제품의 품질을 정량화하고 결함을 검출하는 검사 지능화, 공정 데이터와 제품의 품질 데이터를 이용하여 공정을 분석하는 공정 지능화, 마지막으로 원료와 제품의 물류에 대한 물류 지능화이다. 여기에서는 5가지 중 3가지 분야에 대한 예시를 이용하여 설명하고자 한다.
■설계 지능화
설계 지능화 분야에서 소개할 인공지능 적용 예시는 합금 소재의 미세조직 분석 기술이다. 소재의 물성과 미세조직과의 관계를 추론할 수 있다면, 원하는 물성을 확보하기 위한 소재의 미세조직 형상을 설계할 수 있을 것이다. 이를 위해서 먼저 미세조직이 어떻게 이루어졌는지 수치로 정량화할 필요가 있다.
<그림 2>처럼 소재와 미세조직을 이루고 있는 형상이 몇 개가 있고 각 형상별로 면적이 전체 면적대비 얼마인지를 정량화 할 수 있다면 그 데이터를 이용하여 다양한 연구 개발을 할 수 있다. 이 응용에서는 입력은 미세조직 이미지이고, 출력은 입력 미세조직 이미지와 가로 세로 크기가 같은 화소별 분류값이다. 0번 미세조직에 포함된 화소는 0이고 1번 미세조직에 포함된 화소는 1로 출력이 된다. 인공지능은 입력인 미세조직 이미지를 분석하여 출력인 화소별 분류 값이 정확히 나오도록 학습된다.
▲ <그림 2>미세조직 분석을 위한 데이터
■설비 상태 진단 및 이상 감지
핵심 설비에 대한 동작 상태나 이상을 감지하고 나아가서 고장과 수명을 예측하는 기술(PHM :Prognostics and Health Management) 또한 인공지능 기술이 많이 연구되는 분야 중 하나이다. 제조설비 중 많은 부분이 회전 설비로 이루어져 있는데, 보통 회전 설비에 대한 상태진단은 진동 신호를 분석하는 경우가 많다. 예를 들어 특정 시간동안의 진동 신호가 입력이 되고 이 진동 신호가 정상이면 0, 이상 상태면 1로 출력이 나오도록 문제를 정의할 수 있다. 만약 분류가 아니라 과거부터 현재까지의 진동 신호를 입력 받아서 앞으로 발생될 진동을 예측하고자 할때는 입력은 특정 시간동안의 진동신호와 동일하지만 출력은 0이나 1이 아닌 다음 시간의 발생한 진동신호가 될 것이다.
■검사 지능화
제품의 결함 검사는 일차적으로 결함이 있는 제품을 수요자에게 공급되지 않게 하는 역할뿐만 아니라 더 나아가서 제품의 품질을 정량화하고 데이터베이스(DB)화하여 공정 조건과 제품의 품질과의 상관성을 분석할 때 필요한 핵심적인 데이터를 생성하는 역할을 한다.
또한 제품 품질과 설비 상태와의 연관성을 파악하고, 실시간 결함 검사의 경우 대량불량 발생을 방지하는데 큰 역할을 할 수 있다. 표면 결함 검사의 경우 입력 데이터는 비전 시스템에서 획득된 2D 이미지인 경우가 많다.
제품의 양불을 판정하는 경우라면 출력 데이터는 양품이면 0, 불량이면 1로 레이블링 하는 이진 분류 문제로 정의할 수 있다. 불량을 원인별로 분석하고 싶다면, 양품 0, A불량 1, B 불량 2와 같이 다중 분류 문제로 레이블링을 진행한다. 만약 이미지내에 불량의 위치를 출력하고 싶다면 출력은 위치정보(x, y, width, height, 결함명)가 나오도록 할 수 있는 객체 검출(Object Detection)로 정의할 수 있고, 더 나아가서 결함의 형태까지도 분석하고 싶다면 앞에서 설명한 영상분할모델을 학습할 수 있는 화소별 분류값으로 레이블링을 진행한다. 이와 같이 같은 입력 데이터라도 원하는 목적에 따라서 출력의 형태와 인공지능 알고리즘이 다르게 적용되어야 한다.
■데이터 확보의 어려움
양질의 데이터를 획득할 수 있고 풀고자 하는 문제가 잘 정의되어 있다면 인공지능 기술을 적용하여 다양한 문제를 풀 수 있는 준비가 끝났다. 하지만 실제 제조업에 인공지능 기술을 적용하려고 할 때 양질의 데이터 확보의 어려움에 직면하게 되는 경우가 많다. 절대적인 데이터 수가 부족한 경우를 포함하여, 아래와 같이 다양한 데이터 부족 현상이 발생할 수 있다.
▷불균형 데이터
예를 들어 제품 결함의 종류를 분류하고자 한다면 결함 종류별로 데이터를 수집해야 하지만, 결함별로 발생하는 빈도수가 차이가 나기 때문에 동일한 데이터 수를 확보하기가 어려운 경우가 많다. 이런 경우, 인공지능을 학습하더라도 데이터수가 부족한 결함에 대해서는 원하는 성능을 확보하기 어렵다.
설비 이상 상태 감지의 경우에도 이와 같은 문제점이 자주 발생을 한다. 특히 설비의 정상 상태 데이터가 비정상 상태 데이터에 비해 월등히 많은 경우가 많다. 이러한 경우 정상 상태 데이터만으로 학습을 할 수 있는 인공지능 기술이 필요하다.
▷레이블링 어려움
입력 데이터를 확보하기 어려운 경우 뿐만 아니라, 입력 데이터는 확보했지만 정답 데이터를 만들기 어려운 경우 또한 많이 발생한다. 예를 들어 소재의 미세형상 분석의 경우, 분석하고자하는 미세형상의 정답 데이터를 만드는 일에 많은 시간이 소비된다. 이러한 정답 데이터 확보에 많은 시간과 노력이 들어가기 때문에 제조업에 인공지능 적용이 힘들어질 수 있다.
■해결하고자 하는 다양한 시도
절대적인 데이터수가 부족한 경우 데이터 증강(Data augmentation) 기술을 이용하여 인공지능 모델을 학습시키기 위한 학습 데이터를 확보하는 전략을 많이 사용한다. 데이터 증강 기술은 이미지 데이터의 경우 회전, 이동, 확대, 축소, 색변환, 명암변환 등의 이미지 처리 기술을 이용하여 인위적으로 데이터를 변화시켜서 학습을 진행한다.
또한 두 이미지를 합쳐서 새로운 이미지를 만들어내거나(Mixup), 이미지의 일부를 잘라내어 새로운 이미지를 만들고(Cutout), 잘라낸 부분에 다른 이미지를 붙혀서 새로운 이미지를 만드는 (CutMix) 방법을 사용하기도 한다. 최근에는 부족한 입력 데이터 생성하는 인공지능 기반 데이터 생성 기술인 GAN, VAE 등을 이용하여 문제를 해결하기도 한다.
데이터를 생성하는 방법 이외에 많이 사용되는 방법이 전이학습(Transfer learning)이다. 전이학습은 확보가 용이한 데이터를 이용하여 인공지능 모델을 학습시킨 후, 적은 양의 데이터를 이용하여 재학습 하는 방법이다. 예를 들어서 VGG, ResNet 과 같이 충분한 이미지 데이터로 학습이 되어 분류 성능이 검증된 인공지능 모델을 이용하여, 새로운 문제의 데이터에 맞게 모델의 가중치를 미세조정(Fine-tuning) 하기도 한다.
정답 데이터 확보가 어려운 경우에 대해서 살펴보자. 정답 데이터 레이블링에 대한 노력과 수고를 최소화하기 위한 방법이 크게 두 가지로 나눌 수 있다. 약지도학습(Weakly Supervised Learning)과 준지도학습(Semi Supervised Learning)이다. 준지도학습은 입력데이터의 일부만 레이블링을 하고 레이블링 하지 않은 입력데이터도 포함해서 학습을 진행하는 방법이다. 예를 들어 10000장의 제품 이미지가 있다면 500장만 정상이면 0, 불량이면 1로 레이블링을 하고 나머지 9500장은 레이블링을 하지 않은채로 전체 10000장의 데이터를 이용하여 학습을 하는 방법이다.
약지도 학습은 준지도 학습과 놓여진 상황이 다르다. 준지도 학습과는 달리 약지도 학습은 입력데이터 각각에 정답 데이터를 만들어야 한다. 하지만 정답의 형태를 간소화하여 시간과 노력을 줄이는 방법이다. 예를 들어서 이미지에서 특정한 객체의 형태를 인공지능으로 추출하고 싶으면 정확한 형태가 학습될 수 있도록 정답 데이터를 만들어야 한다. 하지만 약지도 학습 방법은 이미지에 특정한 객체가 있다/없다 정보로 인공지능을 학습해도 정확한 형태를 출력할 수 있는 방법이다.
지금까지 제조업에 인공지능을 적용한 대표적 사례와, 인공지능 적용 시 발생하는 데이터 관점에서의 한계점과 해결 방안에 대해서 이야기했다. 제조업에 인공지능 기술을 성공적으로 적용하기 위해서는 제조분야를 포함한 다양한 분야의 최신 기술들을 분석하고 어떤 식으로 입력과 출력을 정의 했는지 면밀히 살펴볼 필요가 있다. 더불어 현실적으로 발생하는 데이터 확보 문제들을 해결하기 위해 다양한 방법들을 적용하고자 하는 노력을 지속적으로 기울인다면 제조업 인공지능 기술 개발의 성공 사례들이 더욱 늘어날 것이라 생각된다.
출처: 신소재신문 http://www.amenews.kr/news/view.php?idx=51058