커넥티드 항만을 위한 물류 인프라 데이터 구축
―
Info.
Customer
Location
Seoul, Korea
AI Type
OCR(Optical Character Recognition), Object Detection
Task type
Bounding Box, Polygon Annotation
Overview
혁신적인 항만 시스템 개발을 위한 자동 모니터링 기술이 필요합니다.
동양시스템즈는 글로벌 IT금융 솔루션 기업으로 보험·증권·물류 등 다양한 분야의 업무 효율을 혁신적으로 향상시키는 시스템을 제공합니다. 글로벌 서플라이체인의 핵심이 되는 항만 시스템의 효율성 증대를 위해 ‘NIA 커넥티드 항만을 위한 물류 인프라 데이터 구축 사업’에 주관 기업으로 참여했습니다. 항만은 글로벌 공급망에서 매우 중요한 역할을 하지만, 전 세계의 많은 항만 시스템은 낙후된 기술 아키텍처로 인해 한계에 처해있습니다. 동양시스템즈는 클라우드 기반의 개방적인 아키텍처 애플리케이션과 다양한 항만 파트너와의 실시간 협업, 항만 터미널 내의 각종 자원에 대한 실시간 모니터링을 제공하여 항만 시스템의 혁신을 지원하고 있습니다.
경쟁력 있는 항만 시스템의 개발을 위해서는 항만 터미널 내의 인력과 장비, 비용 등 각종 자원에 대한 모니터링 기술이 반드시 필요합니다. 컨테이너의 크기와 형태를 자동으로 인식하고 종류에 따라 분류하는 기술이 대표적인데요. 컨테이너와 트위스트 락 등에 대한 ‘객체 탐지(Object Detection)’와 컨테이너 겉면에 표기된 코드(Code)를 자동 인식하는 ‘OCR(Optical Character Recognition)’ 등의 AI 기술이 뒷받침되어야 실시간 모니터링을 통해 항만 물류 자동화를 실현시킬 수 있습니다.
이런 인공지능 기술 개발을 위해서는 어떤 데이터가 필요할까요? 먼저 객체 탐지 기술을 위해서는 영상 이미지에서 사물(객체)의 형태와 위치를 표시하는 ‘바운딩 박스(Bounding Box)’ 데이터가 있어야 합니다. 또한, OCR을 개발하려면 점을 찍어 글자 영역을 설정하고 코드 내용을 입력하는 ‘폴리곤 어노테이션(Polygon Annotation)’ 데이터도 필요합니다. 동양시스템즈는 레이블러를 사용하여 60만 장의 이미지에 대한 바운딩 박스·폴리곤 어노테이션 작업을 진행했습니다.
Problem
맑거나 흐리거나, 비가 오거나… 어떤 상황의 이미지라도 높은 정확도를 보일 수 있을까요?
실제 현실을 인공지능 기술로 처리하려면 세상에 존재하는 모든 상황에 대한 데이터가 필요하다고 말해도 과언이 아닙니다. 항만 물류 데이터 역시 마찬가지인데요. 맑고 화창한 날은 물론이고, 어둡거나 흐린 날에도 사물과 글자를 정확히 인식할 수 있어야 하기 때문이죠. 다양한 날씨와 시간대의 이미지 데이터를 충분히 확보해야 어떤 상황에서도 대상과 코드를 정확히 인식하는 AI를 만들 수 있습니다. 그러나 이처럼 어노테이션 대상이 되는 이미지의 종류가 다양할수록 데이터 일관성을 충족하기는 매우 어려워집니다. 가이드라인을 작성한 후에도 계속해서 예외사항이 발생하게 되니까요.
날씨 이외에도 작업을 어렵게 하는 요인은 많습니다. 예를 들어 컨테이너에 표기된 코드가 지워졌거나, 잘 보이지 않거나, 가려지는 등이 대표적인데요. 지워지는 방향과 형태도 매우 다양합니다. 숫자나 문자를 유추할 수 있는 경우가 있고, 그게 어려운 경우도 있죠. 컨테이너·물류 차량 등 사물의 경우에도 사람이나 다른 물체로 가려지거나 작업 대상인지 불분명한 경우 등 여러 상황이 존재할 수 있습니다.
이 모든 상황들을 충분히 포함한 데이터를 대량으로, 일관성 있게 구축할 수 있을까요? 일단 60만 장의 이미지 어노테이션 데이터를 만들려면 최소 수백 명 이상의 사람이 필요합니다. 충분한 사람을 모은 이후에도 차량이나 컨테이너의 전면/측면/후면 각도에 맞춘 상세한 가이드라인을 통해 작업 방법을 안내해야 하죠. 가장 큰 문제는 모든 상황에 대한 가이드라인을 제공하는 것이 불가능에 가깝다는 점인데요. 최대한 많은 예시를 제시했더라도 실제 작업에서는 새로운 상황을 맞닥뜨릴 가능성이 매우 높습니다. 이런 예외 사례가 계속 발생하면 일관성 있는 기준으로 데이터를 만들기는 점점 어려워집니다.
Solution
가이드라인을 제대로 응용하는 사람들을 쉽고 빠르게 찾는 방법
수십만 장에 이르는 항만 터미널 촬영 이미지의 어노테이션 작업을 위해 수백 명의 사람들을 일일이 모집할 필요는 없었습니다. 20만 명의 작업자가 활동하는 크라우드 소싱 플랫폼 ‘레이블러 웹 & 모바일 앱’을 활용했기 때문입니다. 그렇다면 작업을 잘 수행할 수 있는 사람이 누구인지는 어떻게 알 수 있을까요?
레이블러 AQC는 고도화된 자격 검증 방식으로 나에게 필요한 사람 지능 태스크를 처리하기에 적합한 사람들을 자동으로 찾아낼 수 있습니다. 가이드라인을 자격 검증 태스크(Qualification Task)로 명확하게 정의만 해주세요. 초기 자격 검증 태스크를 기준 이상으로 통과한 사람만 본 작업에 참여가 가능하며, 본 작업을 수행하는 도중에도 작업자들이 모르는 사이에 주어진 수시 검증 태스크 결과에 따라 계속 참여할 수 있을지가 결정됩니다. 세상에 존재하는 모든 것에 대해 가이드를 제공할 수는 없지만 적절하게 응용할 줄 아는 사람은 찾을 수 있으니까요.
이 모든 과정은 레이블러 AQC에 탑재된 인공지능에 의해 자동으로 진행됩니다. 100~200건 정도의 자격 검증 태스크를 정의하면 이후 수천~수백만 건 태스크에 대한 퀄리티 컨트롤도 자동으로 할 수 있는 것이죠. 유독 어려운 유형에는 고난도의 자격 검증을 설정하고, 상대적으로 쉬운 작업은 난이도를 조정하여 처리량을 높이는 방식으로 조절할 수도 있습니다. 어둡거나 흐린 날씨에 촬영된 이미지, 혹은 지워져서 잘 보이지 않는 글자 등에 대한 판단을 잘 하는 사람들에게만 참여 기회를 주고 싶다면 그에 맞는 자격 검증 태스크만 정의해 주세요. 아무리 까다로운 작업이라도 가이드에 제시된 기준을 적절하게 응용하여 처리할 줄 아는 사람들을 손쉽게 찾을 수 있습니다.
애매하거나 불확실한 데이터를 1명의 판단에만 맡길 수 없다면, 다수가 판단하게 하여 데이터 신뢰도를 높여주세요. 레이블러 엘라스틱 워크플로우(Elastic Workflow, EWF)는 태스크 유형에 따라 유연하게 변화하는 강력한 워크플로우로, 각 유형에 최적화된 처리 방식을 제공합니다. 1개의 태스크를 처리하기 위해 여러 명의 사람들이 협업하거나 혹은 AI의 도움을 받아 인공지능과 사람이 협업하는 방식으로 태스크를 처리할 수도 있습니다.
레이블러 브레인 API를 활용하면 대량의 데이터를 처리할 때 발생하는 리스크를 줄이면서도 효과적으로 데이터를 구축할 수 있습니다. 작게 시작해서 점진적으로 처리량을 늘려가는 방식으로 데이터 어노테이션 과정에서 발생하는 문제들을 먼저 확인해보세요. 레이블러 브레인 API를 AI 제품이나 서비스에 연동해서 실제 결과물을 바탕으로 점차 개선해간다면 대규모 데이터를 구축할 때 발생하는 예측 불가능한 여러 리스크를 감소시키고 시간과 비용을 절약할 수 있습니다.
Result
60만 장 어노테이션 결과, TTA 검증 목표 99% 달성·구축 기간 30% 이상 감소
동양시스템즈는 레이블러를 이용하여 60만 장 이미지 어노테이션 데이터를 성공적으로 구축했습니다. 한국정보통신기술협회(TTA) 품질 검증은 목표치인 90%를 훨씬 상회하는 99.21%을 달성했으며, 목표 기간보다 30% 감소하여 데이터를 구축할 수 있었습니다. 데이터 구축 과정에서 수백 명의 사람들을 모집하거나 교육하는 일은 필요하지 않았습니다.
또한, 다양한 환경에 따라 발생하는 예외사항들에 대한 적절한 가이드라인과 함께 이를 제대로 수행할 수 있는 사람들이 참여하여 고품질의 데이터를 빠른 시간에 구축할 수 있었습니다. 절약한 시간과 비용은 누구보다 빠르게 AI 제품과 서비스를 개발하고 출시하는 일에 사용할 수 있습니다. 레이블러는 새로운 방식의 AIOps로써, 고객이 더 빠른 AI 혁신을 실현하도록 지원합니다.
커넥티드 항만을 위한 물류 인프라 데이터 구축
―
Info.
Customer
Location
Seoul, Korea
AI Type
OCR(Optical Character Recognition), Object Detection
Task type
Bounding Box, Polygon Annotation
Overview
혁신적인 항만 시스템 개발을 위한 자동 모니터링 기술이 필요합니다.
동양시스템즈는 글로벌 IT금융 솔루션 기업으로 보험·증권·물류 등 다양한 분야의 업무 효율을 혁신적으로 향상시키는 시스템을 제공합니다. 글로벌 서플라이체인의 핵심이 되는 항만 시스템의 효율성 증대를 위해 ‘NIA 커넥티드 항만을 위한 물류 인프라 데이터 구축 사업’에 주관 기업으로 참여했습니다. 항만은 글로벌 공급망에서 매우 중요한 역할을 하지만, 전 세계의 많은 항만 시스템은 낙후된 기술 아키텍처로 인해 한계에 처해있습니다. 동양시스템즈는 클라우드 기반의 개방적인 아키텍처 애플리케이션과 다양한 항만 파트너와의 실시간 협업, 항만 터미널 내의 각종 자원에 대한 실시간 모니터링을 제공하여 항만 시스템의 혁신을 지원하고 있습니다.
경쟁력 있는 항만 시스템의 개발을 위해서는 항만 터미널 내의 인력과 장비, 비용 등 각종 자원에 대한 모니터링 기술이 반드시 필요합니다. 컨테이너의 크기와 형태를 자동으로 인식하고 종류에 따라 분류하는 기술이 대표적인데요. 컨테이너와 트위스트 락 등에 대한 ‘객체 탐지(Object Detection)’와 컨테이너 겉면에 표기된 코드(Code)를 자동 인식하는 ‘OCR(Optical Character Recognition)’ 등의 AI 기술이 뒷받침되어야 실시간 모니터링을 통해 항만 물류 자동화를 실현시킬 수 있습니다.
이런 인공지능 기술 개발을 위해서는 어떤 데이터가 필요할까요? 먼저 객체 탐지 기술을 위해서는 영상 이미지에서 사물(객체)의 형태와 위치를 표시하는 ‘바운딩 박스(Bounding Box)’ 데이터가 있어야 합니다. 또한, OCR을 개발하려면 점을 찍어 글자 영역을 설정하고 코드 내용을 입력하는 ‘폴리곤 어노테이션(Polygon Annotation)’ 데이터도 필요합니다. 동양시스템즈는 레이블러를 사용하여 60만 장의 이미지에 대한 바운딩 박스·폴리곤 어노테이션 작업을 진행했습니다.
Problem
맑거나 흐리거나, 비가 오거나… 어떤 상황의 이미지라도 높은 정확도를 보일 수 있을까요?
실제 현실을 인공지능 기술로 처리하려면 세상에 존재하는 모든 상황에 대한 데이터가 필요하다고 말해도 과언이 아닙니다. 항만 물류 데이터 역시 마찬가지인데요. 맑고 화창한 날은 물론이고, 어둡거나 흐린 날에도 사물과 글자를 정확히 인식할 수 있어야 하기 때문이죠. 다양한 날씨와 시간대의 이미지 데이터를 충분히 확보해야 어떤 상황에서도 대상과 코드를 정확히 인식하는 AI를 만들 수 있습니다. 그러나 이처럼 어노테이션 대상이 되는 이미지의 종류가 다양할수록 데이터 일관성을 충족하기는 매우 어려워집니다. 가이드라인을 작성한 후에도 계속해서 예외사항이 발생하게 되니까요.
날씨 이외에도 작업을 어렵게 하는 요인은 많습니다. 예를 들어 컨테이너에 표기된 코드가 지워졌거나, 잘 보이지 않거나, 가려지는 등이 대표적인데요. 지워지는 방향과 형태도 매우 다양합니다. 숫자나 문자를 유추할 수 있는 경우가 있고, 그게 어려운 경우도 있죠. 컨테이너·물류 차량 등 사물의 경우에도 사람이나 다른 물체로 가려지거나 작업 대상인지 불분명한 경우 등 여러 상황이 존재할 수 있습니다.
이 모든 상황들을 충분히 포함한 데이터를 대량으로, 일관성 있게 구축할 수 있을까요? 일단 60만 장의 이미지 어노테이션 데이터를 만들려면 최소 수백 명 이상의 사람이 필요합니다. 충분한 사람을 모은 이후에도 차량이나 컨테이너의 전면/측면/후면 각도에 맞춘 상세한 가이드라인을 통해 작업 방법을 안내해야 하죠. 가장 큰 문제는 모든 상황에 대한 가이드라인을 제공하는 것이 불가능에 가깝다는 점인데요. 최대한 많은 예시를 제시했더라도 실제 작업에서는 새로운 상황을 맞닥뜨릴 가능성이 매우 높습니다. 이런 예외 사례가 계속 발생하면 일관성 있는 기준으로 데이터를 만들기는 점점 어려워집니다.
Solution
가이드라인을 제대로 응용하는 사람들을 쉽고 빠르게 찾는 방법
수십만 장에 이르는 항만 터미널 촬영 이미지의 어노테이션 작업을 위해 수백 명의 사람들을 일일이 모집할 필요는 없었습니다. 20만 명의 작업자가 활동하는 크라우드 소싱 플랫폼 ‘레이블러 웹 & 모바일 앱’을 활용했기 때문입니다. 그렇다면 작업을 잘 수행할 수 있는 사람이 누구인지는 어떻게 알 수 있을까요?
레이블러 AQC는 고도화된 자격 검증 방식으로 나에게 필요한 사람 지능 태스크를 처리하기에 적합한 사람들을 자동으로 찾아낼 수 있습니다. 가이드라인을 자격 검증 태스크(Qualification Task)로 명확하게 정의만 해주세요. 초기 자격 검증 태스크를 기준 이상으로 통과한 사람만 본 작업에 참여가 가능하며, 본 작업을 수행하는 도중에도 작업자들이 모르는 사이에 주어진 수시 검증 태스크 결과에 따라 계속 참여할 수 있을지가 결정됩니다. 세상에 존재하는 모든 것에 대해 가이드를 제공할 수는 없지만 적절하게 응용할 줄 아는 사람은 찾을 수 있으니까요.
이 모든 과정은 레이블러 AQC에 탑재된 인공지능에 의해 자동으로 진행됩니다. 100~200건 정도의 자격 검증 태스크를 정의하면 이후 수천~수백만 건 태스크에 대한 퀄리티 컨트롤도 자동으로 할 수 있는 것이죠. 유독 어려운 유형에는 고난도의 자격 검증을 설정하고, 상대적으로 쉬운 작업은 난이도를 조정하여 처리량을 높이는 방식으로 조절할 수도 있습니다. 어둡거나 흐린 날씨에 촬영된 이미지, 혹은 지워져서 잘 보이지 않는 글자 등에 대한 판단을 잘 하는 사람들에게만 참여 기회를 주고 싶다면 그에 맞는 자격 검증 태스크만 정의해 주세요. 아무리 까다로운 작업이라도 가이드에 제시된 기준을 적절하게 응용하여 처리할 줄 아는 사람들을 손쉽게 찾을 수 있습니다.
애매하거나 불확실한 데이터를 1명의 판단에만 맡길 수 없다면, 다수가 판단하게 하여 데이터 신뢰도를 높여주세요. 레이블러 엘라스틱 워크플로우(Elastic Workflow, EWF)는 태스크 유형에 따라 유연하게 변화하는 강력한 워크플로우로, 각 유형에 최적화된 처리 방식을 제공합니다. 1개의 태스크를 처리하기 위해 여러 명의 사람들이 협업하거나 혹은 AI의 도움을 받아 인공지능과 사람이 협업하는 방식으로 태스크를 처리할 수도 있습니다.
레이블러 브레인 API를 활용하면 대량의 데이터를 처리할 때 발생하는 리스크를 줄이면서도 효과적으로 데이터를 구축할 수 있습니다. 작게 시작해서 점진적으로 처리량을 늘려가는 방식으로 데이터 어노테이션 과정에서 발생하는 문제들을 먼저 확인해보세요. 레이블러 브레인 API를 AI 제품이나 서비스에 연동해서 실제 결과물을 바탕으로 점차 개선해간다면 대규모 데이터를 구축할 때 발생하는 예측 불가능한 여러 리스크를 감소시키고 시간과 비용을 절약할 수 있습니다.
Result
60만 장 어노테이션 결과, TTA 검증 목표 99% 달성·구축 기간 30% 이상 감소
동양시스템즈는 레이블러를 이용하여 60만 장 이미지 어노테이션 데이터를 성공적으로 구축했습니다. 한국정보통신기술협회(TTA) 품질 검증은 목표치인 90%를 훨씬 상회하는 99.21%을 달성했으며, 목표 기간보다 30% 감소하여 데이터를 구축할 수 있었습니다. 데이터 구축 과정에서 수백 명의 사람들을 모집하거나 교육하는 일은 필요하지 않았습니다.
또한, 다양한 환경에 따라 발생하는 예외사항들에 대한 적절한 가이드라인과 함께 이를 제대로 수행할 수 있는 사람들이 참여하여 고품질의 데이터를 빠른 시간에 구축할 수 있었습니다. 절약한 시간과 비용은 누구보다 빠르게 AI 제품과 서비스를 개발하고 출시하는 일에 사용할 수 있습니다. 레이블러는 새로운 방식의 AIOps로써, 고객이 더 빠른 AI 혁신을 실현하도록 지원합니다.
커넥티드 항만을 위한 물류 인프라 데이터 구축
―
Info.
Customer
Location
Seoul, Korea
AI Type
OCR(Optical Character Recognition), Object Detection
Task type
Bounding Box, Polygon Annotation
Overview
혁신적인 항만 시스템 개발을 위한 자동 모니터링 기술이 필요합니다.
동양시스템즈는 글로벌 IT금융 솔루션 기업으로 보험·증권·물류 등 다양한 분야의 업무 효율을 혁신적으로 향상시키는 시스템을 제공합니다. 글로벌 서플라이체인의 핵심이 되는 항만 시스템의 효율성 증대를 위해 ‘NIA 커넥티드 항만을 위한 물류 인프라 데이터 구축 사업’에 주관 기업으로 참여했습니다. 항만은 글로벌 공급망에서 매우 중요한 역할을 하지만, 전 세계의 많은 항만 시스템은 낙후된 기술 아키텍처로 인해 한계에 처해있습니다. 동양시스템즈는 클라우드 기반의 개방적인 아키텍처 애플리케이션과 다양한 항만 파트너와의 실시간 협업, 항만 터미널 내의 각종 자원에 대한 실시간 모니터링을 제공하여 항만 시스템의 혁신을 지원하고 있습니다.
경쟁력 있는 항만 시스템의 개발을 위해서는 항만 터미널 내의 인력과 장비, 비용 등 각종 자원에 대한 모니터링 기술이 반드시 필요합니다. 컨테이너의 크기와 형태를 자동으로 인식하고 종류에 따라 분류하는 기술이 대표적인데요. 컨테이너와 트위스트 락 등에 대한 ‘객체 탐지(Object Detection)’와 컨테이너 겉면에 표기된 코드(Code)를 자동 인식하는 ‘OCR(Optical Character Recognition)’ 등의 AI 기술이 뒷받침되어야 실시간 모니터링을 통해 항만 물류 자동화를 실현시킬 수 있습니다.
이런 인공지능 기술 개발을 위해서는 어떤 데이터가 필요할까요? 먼저 객체 탐지 기술을 위해서는 영상 이미지에서 사물(객체)의 형태와 위치를 표시하는 ‘바운딩 박스(Bounding Box)’ 데이터가 있어야 합니다. 또한, OCR을 개발하려면 점을 찍어 글자 영역을 설정하고 코드 내용을 입력하는 ‘폴리곤 어노테이션(Polygon Annotation)’ 데이터도 필요합니다. 동양시스템즈는 레이블러를 사용하여 60만 장의 이미지에 대한 바운딩 박스·폴리곤 어노테이션 작업을 진행했습니다.
Problem
맑거나 흐리거나, 비가 오거나… 어떤 상황의 이미지라도 높은 정확도를 보일 수 있을까요?
실제 현실을 인공지능 기술로 처리하려면 세상에 존재하는 모든 상황에 대한 데이터가 필요하다고 말해도 과언이 아닙니다. 항만 물류 데이터 역시 마찬가지인데요. 맑고 화창한 날은 물론이고, 어둡거나 흐린 날에도 사물과 글자를 정확히 인식할 수 있어야 하기 때문이죠. 다양한 날씨와 시간대의 이미지 데이터를 충분히 확보해야 어떤 상황에서도 대상과 코드를 정확히 인식하는 AI를 만들 수 있습니다. 그러나 이처럼 어노테이션 대상이 되는 이미지의 종류가 다양할수록 데이터 일관성을 충족하기는 매우 어려워집니다. 가이드라인을 작성한 후에도 계속해서 예외사항이 발생하게 되니까요.
날씨 이외에도 작업을 어렵게 하는 요인은 많습니다. 예를 들어 컨테이너에 표기된 코드가 지워졌거나, 잘 보이지 않거나, 가려지는 등이 대표적인데요. 지워지는 방향과 형태도 매우 다양합니다. 숫자나 문자를 유추할 수 있는 경우가 있고, 그게 어려운 경우도 있죠. 컨테이너·물류 차량 등 사물의 경우에도 사람이나 다른 물체로 가려지거나 작업 대상인지 불분명한 경우 등 여러 상황이 존재할 수 있습니다.
이 모든 상황들을 충분히 포함한 데이터를 대량으로, 일관성 있게 구축할 수 있을까요? 일단 60만 장의 이미지 어노테이션 데이터를 만들려면 최소 수백 명 이상의 사람이 필요합니다. 충분한 사람을 모은 이후에도 차량이나 컨테이너의 전면/측면/후면 각도에 맞춘 상세한 가이드라인을 통해 작업 방법을 안내해야 하죠. 가장 큰 문제는 모든 상황에 대한 가이드라인을 제공하는 것이 불가능에 가깝다는 점인데요. 최대한 많은 예시를 제시했더라도 실제 작업에서는 새로운 상황을 맞닥뜨릴 가능성이 매우 높습니다. 이런 예외 사례가 계속 발생하면 일관성 있는 기준으로 데이터를 만들기는 점점 어려워집니다.
Solution
가이드라인을 제대로 응용하는 사람들을 쉽고 빠르게 찾는 방법
수십만 장에 이르는 항만 터미널 촬영 이미지의 어노테이션 작업을 위해 수백 명의 사람들을 일일이 모집할 필요는 없었습니다. 20만 명의 작업자가 활동하는 크라우드 소싱 플랫폼 ‘레이블러 웹 & 모바일 앱’을 활용했기 때문입니다. 그렇다면 작업을 잘 수행할 수 있는 사람이 누구인지는 어떻게 알 수 있을까요?
레이블러 AQC는 고도화된 자격 검증 방식으로 나에게 필요한 사람 지능 태스크를 처리하기에 적합한 사람들을 자동으로 찾아낼 수 있습니다. 가이드라인을 자격 검증 태스크(Qualification Task)로 명확하게 정의만 해주세요. 초기 자격 검증 태스크를 기준 이상으로 통과한 사람만 본 작업에 참여가 가능하며, 본 작업을 수행하는 도중에도 작업자들이 모르는 사이에 주어진 수시 검증 태스크 결과에 따라 계속 참여할 수 있을지가 결정됩니다. 세상에 존재하는 모든 것에 대해 가이드를 제공할 수는 없지만 적절하게 응용할 줄 아는 사람은 찾을 수 있으니까요.
이 모든 과정은 레이블러 AQC에 탑재된 인공지능에 의해 자동으로 진행됩니다. 100~200건 정도의 자격 검증 태스크를 정의하면 이후 수천~수백만 건 태스크에 대한 퀄리티 컨트롤도 자동으로 할 수 있는 것이죠. 유독 어려운 유형에는 고난도의 자격 검증을 설정하고, 상대적으로 쉬운 작업은 난이도를 조정하여 처리량을 높이는 방식으로 조절할 수도 있습니다. 어둡거나 흐린 날씨에 촬영된 이미지, 혹은 지워져서 잘 보이지 않는 글자 등에 대한 판단을 잘 하는 사람들에게만 참여 기회를 주고 싶다면 그에 맞는 자격 검증 태스크만 정의해 주세요. 아무리 까다로운 작업이라도 가이드에 제시된 기준을 적절하게 응용하여 처리할 줄 아는 사람들을 손쉽게 찾을 수 있습니다.
애매하거나 불확실한 데이터를 1명의 판단에만 맡길 수 없다면, 다수가 판단하게 하여 데이터 신뢰도를 높여주세요. 레이블러 엘라스틱 워크플로우(Elastic Workflow, EWF)는 태스크 유형에 따라 유연하게 변화하는 강력한 워크플로우로, 각 유형에 최적화된 처리 방식을 제공합니다. 1개의 태스크를 처리하기 위해 여러 명의 사람들이 협업하거나 혹은 AI의 도움을 받아 인공지능과 사람이 협업하는 방식으로 태스크를 처리할 수도 있습니다.
레이블러 브레인 API를 활용하면 대량의 데이터를 처리할 때 발생하는 리스크를 줄이면서도 효과적으로 데이터를 구축할 수 있습니다. 작게 시작해서 점진적으로 처리량을 늘려가는 방식으로 데이터 어노테이션 과정에서 발생하는 문제들을 먼저 확인해보세요. 레이블러 브레인 API를 AI 제품이나 서비스에 연동해서 실제 결과물을 바탕으로 점차 개선해간다면 대규모 데이터를 구축할 때 발생하는 예측 불가능한 여러 리스크를 감소시키고 시간과 비용을 절약할 수 있습니다.
Result
60만 장 어노테이션 결과, TTA 검증 목표 99% 달성·구축 기간 30% 이상 감소
동양시스템즈는 레이블러를 이용하여 60만 장 이미지 어노테이션 데이터를 성공적으로 구축했습니다. 한국정보통신기술협회(TTA) 품질 검증은 목표치인 90%를 훨씬 상회하는 99.21%을 달성했으며, 목표 기간보다 30% 감소하여 데이터를 구축할 수 있었습니다. 데이터 구축 과정에서 수백 명의 사람들을 모집하거나 교육하는 일은 필요하지 않았습니다.
또한, 다양한 환경에 따라 발생하는 예외사항들에 대한 적절한 가이드라인과 함께 이를 제대로 수행할 수 있는 사람들이 참여하여 고품질의 데이터를 빠른 시간에 구축할 수 있었습니다. 절약한 시간과 비용은 누구보다 빠르게 AI 제품과 서비스를 개발하고 출시하는 일에 사용할 수 있습니다. 레이블러는 새로운 방식의 AIOps로써, 고객이 더 빠른 AI 혁신을 실현하도록 지원합니다.