인공지능 스마트 양식 솔루션을 위한 어류 행동 어노테이션
―
Info.
Overview
AI 스마트 양식 솔루션을 개발하려면 양식 어류의 행동 패턴을 파악해야 해요.
글로비트는 친환경 인공지능 스마트 양식 시스템을 제공하는 IT 기업입니다. AI와 빅데이터를 기반으로 생산 자율 관리가 가능한 4세대 지능형 스마트 양식 솔루션을 통해 친환경적이면서도 효율적인 양식장 경영을 지원하고 있습니다. 양식 과정에 인공지능 기술을 결합하여 AI가 양식 어류의 성장과 사이즈·사료 급여·입식과 출하 등의 관리부터 IoT 기반의 수질 환경 모니터링 및 제어, 생육 과정 데이터화, 안전사고 예방까지 관여하는 시스템으로 모든 과정을 최적화하여 관리할 수 있는 것이죠.
인공지능 기반의 스마트 양식 솔루션을 제공하려면 뛰어난 기술력은 물론이고, 폭넓은 AI 기술이 뒷받침되어야 합니다. 소수의 AI 기술로는 양식의 전 과정에 인공지능을 적용할 수 없기 때문이죠. 수질의 오염도를 영상으로 자동 분석해 수질 환경을 자동 모니터링하거나 양식 어류의 성장 상태를 분석하여 자동으로 사료를 급여하는 기능은 서로 다른 AI 기술을 필요로 합니다. 글로비트는 수조 내 어류의 종류를 인식하고 행동을 분석하는 AI 기능 개발을 위해 레이블러를 사용하여 NIA 인공지능 학습데이터 구축 사업의 어류 행동 영상 데이터 구축에 주관 기업으로 참여했습니다.
Problem
수조 안에서 뒤엉켜 헤엄치는 어류들을 정확하게 구분할 수 있을까요?
수조 내에서 헤엄치는 어류의 종류와 행동 패턴의 자동 분석은 양식 어류 관리를 위해 기본적으로 필요한 AI 기술입니다. 그러나 실제 데이터를 마련하는 과정은 수월하지 않습니다. 먼저 수조 안에서 헤엄치는 어류 영상을 촬영하고 프레임에 따라 분류하여 원천 데이터를 마련합니다. 수조 안에는 당연히 한 마리의 물고기만 존재하지 않습니다. 실제 양식 환경과 동일한 상황에서 개체를 인식해야 하기 때문이죠. 일반적인 양식 환경처럼 여러 마리의 물고기가 정해진 공간에서 뒤엉켜 헤엄치는 이미지에서 한 마리 개체를 정확하게 인식할 수 있는 AI 기술을 개발해야 합니다.
물고기의 형태와 움직임을 인식하는 ‘객체 탐지(Object Detection)’ 기술을 개발하려면 어류 형태에 맞게 ‘바운딩 박스(Bounding Box)’와 ‘폴리 라인(Polyline Annotation)’으로 어노테이션 된 이미지 데이터가 필요합니다. 바운딩 박스로 물고기의 형태 영역을 설정하고 폴리 라인으로 선을 그어 체장(몸길이)과 체고(몸높이)를 표시하는 것이죠. 일관성 있는 학습 데이터가 만들어지면 수많은 물고기가 헤엄치는 수조에서 한 마리, 한 마리를 정확하게 구분하는 AI가 탄생할 수 있습니다.
하지만 앞서 말한 것처럼 이런 데이터를 일관성 있게 만드는 일은 쉽지 않습니다. 일단 여러 마리가 뒤엉켜 헤엄치고 있어서 물고기 대다수가 서로에 의해 가려져 있습니다. 전체적인 형태를 파악하기가 힘든 것이죠. 물고기의 유연한 움직임도 문제입니다. 길고 유연한 몸체를 가진 어류일수록 다양한 각도로 휘어져 몸길이를 확인하기 어렵습니다. 당연히 어종과 개체에 따라 달라지는 불규칙적인 모든 움직임을 가이드라인에 전부 소개할 수도 없습니다.
실제 현장에서 활용할 만한 수준의 인공지능을 만들려면 대규모 데이터가 필요하다는 점도 중요합니다. 글로비트는 레이블러를 이용해서 다섯 가지 어종(넙치·조피볼락·참돔·감성돔·돌돔)마다 각 24만 개체, 총 120만 개체를 어노테이션 한 데이터를 구축했는데요. 이처럼 백만 마리 이상의 개체를 레이블링하려면 작업자 모집·교육·관리에 많은 시간과 비용이 들어갑니다.
또한, 실제 작업을 진행하기 전에는 이미지 1장당 몇 마리의 개체가 있을 지 알기 힘들다는 점에서 불필요한 비용이 낭비될 가능성도 있습니다. 일부 어종만 필요한 데이터 수량을 초과하거나 반대로 너무 부족한 상황이 발생할 수 있는 것이죠. 데이터를 대량으로 구축하면서도 자유로운 움직임을 일관성 있게 어노테이션 할 수 있는 방법이 있을까요? 그렇게 할 수 있다면, 데이터 구축에 들어갈 시간과 비용을 절약하여 더 중요한 AI 개발에 집중할 수 있을거예요.
Solution
물고기의 자유로운 움직임을 데이터로 만드는 법
어류 행동 패턴과 같은 대규모 데이터를 구축하려면 수백 명의 어노테이션 작업자가 필요합니다. 바운딩 박스와 폴리 라인을 작업할 수 있을 뿐 아니라, 어류의 다양한 행동 패턴을 보면서 주어진 가이드라인을 기준으로 적절하게 응용할 수 있는 사람이 필요한데요. 레이블러는 20만 명이 활동하는 크라우드 소싱 플랫폼 ‘레이블러 웹 & 모바일 앱’을 통해 나에게 필요한 사람 지능을 빠르게 확보할 수 있습니다.
그중에서도 물고기의 자유로운 움직임을 적절하게 작업할 수 있는 사람은 어떻게 찾을 수 있을까요? 몸 색이 어둡고 납작해서 형태를 파악하기 어려운 넙치와, 색과 형태는 분명하지만 움직임이 빨라 순간 형태가 매우 다양한 돌돔은 다른 어종보다 뛰어난 관찰력과 섬세한 작업이 필요합니다. 참돔을 성공적으로 어노테이션 한 사람이라도 넙치와 돌돔의 작업 품질은 상대적으로 떨어질 수 있는 것이죠. 이처럼 같은 태스크 안에서도 원천 데이터나 작업 유형에 따라 요구되는 능력과 수준이 매우 달라질 수 있습니다.
레이블러 AQC를 사용하면 다양한 요구사항에 적합한 작업자를 매번 찾을 필요 없이, 자격 검증 태스크(Qualification Task)로 사전에 정의된 기준에 따라 자동으로 선발·관리할 수 있습니다. 작업자들은 가이드라인을 숙지하고 초기 자격 검증 태스크를 기준 이상으로 통과해야 본 작업에 참여할 수 있고, 이후에도 랜덤하게 주어지는 수시 검증 태스크를 거쳐야 작업 진행이 가능합니다. 작업을 진행하면서 집중력이 흩어지거나, 불성실한 작업을 제출하는 것을 제한하기 위한 것이죠.
초기 자격 검증을 어느 정도 수준으로 맞춰야 내가 원하는 데이터 품질이 나올 수 있는지 궁금하신가요? 먼저 아주 적은 수량부터 가볍게 시작해 보세요. 소규모로 시작해서 발생 가능한 리스크를 미리 확인하고 조정하면 이후 레이블러 AQC를 통해 수천, 수백만 건 데이터의 퀄리티 컨트롤을 자동으로 진행할 수 있습니다. 어종별 객체 수량도 자동으로 조절이 가능합니다. 미리 설정한 카테고리 비율에 따라 실시간으로 객체 수량을 파악하여 목표량을 넘긴 어종은 더 이상 작업되지 않도록 조정할 수 있는 것이죠. 레이블러의 유연하고 강력한 ‘엘라스틱 워크플로우(Elastic Workflow, EWF)는 1개 태스크를 위해 사람과 AI가 협업하며 최적의 처리 결과를 이끌어냅니다.
한 번의 데이터 구축에서 멈추지 않고 지속적인 인공지능 개발이 필요한가요? 레이블러 브레인 API를 이용해서 실시간으로 발전하는 AI를 만들어보세요. API를 호출하여 나에게 필요한 사람 지능 태스크를 간단하게 처리할 수 있습니다. 레이블러 브레인 API를 AI 제품이나 서비스에 연결하여 태스크를 처리하는 즉시 AI가 학습하도록 만들어보세요.
Result
어류 120만 개체를 일관성 있게 어노테이션하여 ‘우수 과제’로 선정되었습니다.
글로비트는 레이블러를 이용하여 총 126만 개체의 물고기 이미지 데이터를 구축했습니다. 총 371시간의 어류 행동 영상을 사용하여 각 어종별로 24만 개체 이상을 확보했으며, 데이터 종류도 특정 어종에 치우치지 않고 고르게 분포하도록 구성되었습니다. 상대적으로 작업이 수월했던 참돔이나 감성돔은 물론이고, 작업이 어려웠던 넙치와 돌돔도 일관성을 확보하여 좋은 품질의 데이터를 구축할 수 있었습니다.
레이블러를 사용한 어류 행동 패턴 데이터의 한국정보통신기술협회(TTA) 품질 검증 결과는 98.97%로 목표치인 90%를 월등히 초과했습니다. 이를 바탕으로 해당 사업은 2020년 NIA 인공지능 학습데이터 구축 사업 품질 검증 수행 결과 “우수 과제”로 선정되었습니다. 대규모 어노테이션 작업을 위해 수백 명의 사람을 모집하거나 관리할 필요는 없었습니다. 이 과정에서 절약한 시간과 비용은 더 중요한 일에 사용할 수 있습니다. 레이블러는 고객이 누구보다 빠르게 AI 제품과 서비스를 개발하고 출시할 수 있도록 지원하는 AIOps 솔루션을 제공합니다.
인공지능 스마트 양식 솔루션을 위한 어류 행동 어노테이션
―
Info.
Overview
AI 스마트 양식 솔루션을 개발하려면 양식 어류의 행동 패턴을 파악해야 해요.
글로비트는 친환경 인공지능 스마트 양식 시스템을 제공하는 IT 기업입니다. AI와 빅데이터를 기반으로 생산 자율 관리가 가능한 4세대 지능형 스마트 양식 솔루션을 통해 친환경적이면서도 효율적인 양식장 경영을 지원하고 있습니다. 양식 과정에 인공지능 기술을 결합하여 AI가 양식 어류의 성장과 사이즈·사료 급여·입식과 출하 등의 관리부터 IoT 기반의 수질 환경 모니터링 및 제어, 생육 과정 데이터화, 안전사고 예방까지 관여하는 시스템으로 모든 과정을 최적화하여 관리할 수 있는 것이죠.
인공지능 기반의 스마트 양식 솔루션을 제공하려면 뛰어난 기술력은 물론이고, 폭넓은 AI 기술이 뒷받침되어야 합니다. 소수의 AI 기술로는 양식의 전 과정에 인공지능을 적용할 수 없기 때문이죠. 수질의 오염도를 영상으로 자동 분석해 수질 환경을 자동 모니터링하거나 양식 어류의 성장 상태를 분석하여 자동으로 사료를 급여하는 기능은 서로 다른 AI 기술을 필요로 합니다. 글로비트는 수조 내 어류의 종류를 인식하고 행동을 분석하는 AI 기능 개발을 위해 레이블러를 사용하여 NIA 인공지능 학습데이터 구축 사업의 어류 행동 영상 데이터 구축에 주관 기업으로 참여했습니다.
Problem
수조 안에서 뒤엉켜 헤엄치는 어류들을 정확하게 구분할 수 있을까요?
수조 내에서 헤엄치는 어류의 종류와 행동 패턴의 자동 분석은 양식 어류 관리를 위해 기본적으로 필요한 AI 기술입니다. 그러나 실제 데이터를 마련하는 과정은 수월하지 않습니다. 먼저 수조 안에서 헤엄치는 어류 영상을 촬영하고 프레임에 따라 분류하여 원천 데이터를 마련합니다. 수조 안에는 당연히 한 마리의 물고기만 존재하지 않습니다. 실제 양식 환경과 동일한 상황에서 개체를 인식해야 하기 때문이죠. 일반적인 양식 환경처럼 여러 마리의 물고기가 정해진 공간에서 뒤엉켜 헤엄치는 이미지에서 한 마리 개체를 정확하게 인식할 수 있는 AI 기술을 개발해야 합니다.
물고기의 형태와 움직임을 인식하는 ‘객체 탐지(Object Detection)’ 기술을 개발하려면 어류 형태에 맞게 ‘바운딩 박스(Bounding Box)’와 ‘폴리 라인(Polyline Annotation)’으로 어노테이션 된 이미지 데이터가 필요합니다. 바운딩 박스로 물고기의 형태 영역을 설정하고 폴리 라인으로 선을 그어 체장(몸길이)과 체고(몸높이)를 표시하는 것이죠. 일관성 있는 학습 데이터가 만들어지면 수많은 물고기가 헤엄치는 수조에서 한 마리, 한 마리를 정확하게 구분하는 AI가 탄생할 수 있습니다.
하지만 앞서 말한 것처럼 이런 데이터를 일관성 있게 만드는 일은 쉽지 않습니다. 일단 여러 마리가 뒤엉켜 헤엄치고 있어서 물고기 대다수가 서로에 의해 가려져 있습니다. 전체적인 형태를 파악하기가 힘든 것이죠. 물고기의 유연한 움직임도 문제입니다. 길고 유연한 몸체를 가진 어류일수록 다양한 각도로 휘어져 몸길이를 확인하기 어렵습니다. 당연히 어종과 개체에 따라 달라지는 불규칙적인 모든 움직임을 가이드라인에 전부 소개할 수도 없습니다.
실제 현장에서 활용할 만한 수준의 인공지능을 만들려면 대규모 데이터가 필요하다는 점도 중요합니다. 글로비트는 레이블러를 이용해서 다섯 가지 어종(넙치·조피볼락·참돔·감성돔·돌돔)마다 각 24만 개체, 총 120만 개체를 어노테이션 한 데이터를 구축했는데요. 이처럼 백만 마리 이상의 개체를 레이블링하려면 작업자 모집·교육·관리에 많은 시간과 비용이 들어갑니다.
또한, 실제 작업을 진행하기 전에는 이미지 1장당 몇 마리의 개체가 있을 지 알기 힘들다는 점에서 불필요한 비용이 낭비될 가능성도 있습니다. 일부 어종만 필요한 데이터 수량을 초과하거나 반대로 너무 부족한 상황이 발생할 수 있는 것이죠. 데이터를 대량으로 구축하면서도 자유로운 움직임을 일관성 있게 어노테이션 할 수 있는 방법이 있을까요? 그렇게 할 수 있다면, 데이터 구축에 들어갈 시간과 비용을 절약하여 더 중요한 AI 개발에 집중할 수 있을거예요.
Solution
물고기의 자유로운 움직임을 데이터로 만드는 법
어류 행동 패턴과 같은 대규모 데이터를 구축하려면 수백 명의 어노테이션 작업자가 필요합니다. 바운딩 박스와 폴리 라인을 작업할 수 있을 뿐 아니라, 어류의 다양한 행동 패턴을 보면서 주어진 가이드라인을 기준으로 적절하게 응용할 수 있는 사람이 필요한데요. 레이블러는 20만 명이 활동하는 크라우드 소싱 플랫폼 ‘레이블러 웹 & 모바일 앱’을 통해 나에게 필요한 사람 지능을 빠르게 확보할 수 있습니다.
그중에서도 물고기의 자유로운 움직임을 적절하게 작업할 수 있는 사람은 어떻게 찾을 수 있을까요? 몸 색이 어둡고 납작해서 형태를 파악하기 어려운 넙치와, 색과 형태는 분명하지만 움직임이 빨라 순간 형태가 매우 다양한 돌돔은 다른 어종보다 뛰어난 관찰력과 섬세한 작업이 필요합니다. 참돔을 성공적으로 어노테이션 한 사람이라도 넙치와 돌돔의 작업 품질은 상대적으로 떨어질 수 있는 것이죠. 이처럼 같은 태스크 안에서도 원천 데이터나 작업 유형에 따라 요구되는 능력과 수준이 매우 달라질 수 있습니다.
레이블러 AQC를 사용하면 다양한 요구사항에 적합한 작업자를 매번 찾을 필요 없이, 자격 검증 태스크(Qualification Task)로 사전에 정의된 기준에 따라 자동으로 선발·관리할 수 있습니다. 작업자들은 가이드라인을 숙지하고 초기 자격 검증 태스크를 기준 이상으로 통과해야 본 작업에 참여할 수 있고, 이후에도 랜덤하게 주어지는 수시 검증 태스크를 거쳐야 작업 진행이 가능합니다. 작업을 진행하면서 집중력이 흩어지거나, 불성실한 작업을 제출하는 것을 제한하기 위한 것이죠.
초기 자격 검증을 어느 정도 수준으로 맞춰야 내가 원하는 데이터 품질이 나올 수 있는지 궁금하신가요? 먼저 아주 적은 수량부터 가볍게 시작해 보세요. 소규모로 시작해서 발생 가능한 리스크를 미리 확인하고 조정하면 이후 레이블러 AQC를 통해 수천, 수백만 건 데이터의 퀄리티 컨트롤을 자동으로 진행할 수 있습니다. 어종별 객체 수량도 자동으로 조절이 가능합니다. 미리 설정한 카테고리 비율에 따라 실시간으로 객체 수량을 파악하여 목표량을 넘긴 어종은 더 이상 작업되지 않도록 조정할 수 있는 것이죠. 레이블러의 유연하고 강력한 ‘엘라스틱 워크플로우(Elastic Workflow, EWF)는 1개 태스크를 위해 사람과 AI가 협업하며 최적의 처리 결과를 이끌어냅니다.
한 번의 데이터 구축에서 멈추지 않고 지속적인 인공지능 개발이 필요한가요? 레이블러 브레인 API를 이용해서 실시간으로 발전하는 AI를 만들어보세요. API를 호출하여 나에게 필요한 사람 지능 태스크를 간단하게 처리할 수 있습니다. 레이블러 브레인 API를 AI 제품이나 서비스에 연결하여 태스크를 처리하는 즉시 AI가 학습하도록 만들어보세요.
Result
어류 120만 개체를 일관성 있게 어노테이션하여 ‘우수 과제’로 선정되었습니다.
글로비트는 레이블러를 이용하여 총 126만 개체의 물고기 이미지 데이터를 구축했습니다. 총 371시간의 어류 행동 영상을 사용하여 각 어종별로 24만 개체 이상을 확보했으며, 데이터 종류도 특정 어종에 치우치지 않고 고르게 분포하도록 구성되었습니다. 상대적으로 작업이 수월했던 참돔이나 감성돔은 물론이고, 작업이 어려웠던 넙치와 돌돔도 일관성을 확보하여 좋은 품질의 데이터를 구축할 수 있었습니다.
레이블러를 사용한 어류 행동 패턴 데이터의 한국정보통신기술협회(TTA) 품질 검증 결과는 98.97%로 목표치인 90%를 월등히 초과했습니다. 이를 바탕으로 해당 사업은 2020년 NIA 인공지능 학습데이터 구축 사업 품질 검증 수행 결과 “우수 과제”로 선정되었습니다. 대규모 어노테이션 작업을 위해 수백 명의 사람을 모집하거나 관리할 필요는 없었습니다. 이 과정에서 절약한 시간과 비용은 더 중요한 일에 사용할 수 있습니다. 레이블러는 고객이 누구보다 빠르게 AI 제품과 서비스를 개발하고 출시할 수 있도록 지원하는 AIOps 솔루션을 제공합니다.
인공지능 스마트 양식 솔루션을 위한 어류 행동 어노테이션
―
Info.
Overview
AI 스마트 양식 솔루션을 개발하려면 양식 어류의 행동 패턴을 파악해야 해요.
글로비트는 친환경 인공지능 스마트 양식 시스템을 제공하는 IT 기업입니다. AI와 빅데이터를 기반으로 생산 자율 관리가 가능한 4세대 지능형 스마트 양식 솔루션을 통해 친환경적이면서도 효율적인 양식장 경영을 지원하고 있습니다. 양식 과정에 인공지능 기술을 결합하여 AI가 양식 어류의 성장과 사이즈·사료 급여·입식과 출하 등의 관리부터 IoT 기반의 수질 환경 모니터링 및 제어, 생육 과정 데이터화, 안전사고 예방까지 관여하는 시스템으로 모든 과정을 최적화하여 관리할 수 있는 것이죠.
인공지능 기반의 스마트 양식 솔루션을 제공하려면 뛰어난 기술력은 물론이고, 폭넓은 AI 기술이 뒷받침되어야 합니다. 소수의 AI 기술로는 양식의 전 과정에 인공지능을 적용할 수 없기 때문이죠. 수질의 오염도를 영상으로 자동 분석해 수질 환경을 자동 모니터링하거나 양식 어류의 성장 상태를 분석하여 자동으로 사료를 급여하는 기능은 서로 다른 AI 기술을 필요로 합니다. 글로비트는 수조 내 어류의 종류를 인식하고 행동을 분석하는 AI 기능 개발을 위해 레이블러를 사용하여 NIA 인공지능 학습데이터 구축 사업의 어류 행동 영상 데이터 구축에 주관 기업으로 참여했습니다.
Problem
수조 안에서 뒤엉켜 헤엄치는 어류들을 정확하게 구분할 수 있을까요?
수조 내에서 헤엄치는 어류의 종류와 행동 패턴의 자동 분석은 양식 어류 관리를 위해 기본적으로 필요한 AI 기술입니다. 그러나 실제 데이터를 마련하는 과정은 수월하지 않습니다. 먼저 수조 안에서 헤엄치는 어류 영상을 촬영하고 프레임에 따라 분류하여 원천 데이터를 마련합니다. 수조 안에는 당연히 한 마리의 물고기만 존재하지 않습니다. 실제 양식 환경과 동일한 상황에서 개체를 인식해야 하기 때문이죠. 일반적인 양식 환경처럼 여러 마리의 물고기가 정해진 공간에서 뒤엉켜 헤엄치는 이미지에서 한 마리 개체를 정확하게 인식할 수 있는 AI 기술을 개발해야 합니다.
물고기의 형태와 움직임을 인식하는 ‘객체 탐지(Object Detection)’ 기술을 개발하려면 어류 형태에 맞게 ‘바운딩 박스(Bounding Box)’와 ‘폴리 라인(Polyline Annotation)’으로 어노테이션 된 이미지 데이터가 필요합니다. 바운딩 박스로 물고기의 형태 영역을 설정하고 폴리 라인으로 선을 그어 체장(몸길이)과 체고(몸높이)를 표시하는 것이죠. 일관성 있는 학습 데이터가 만들어지면 수많은 물고기가 헤엄치는 수조에서 한 마리, 한 마리를 정확하게 구분하는 AI가 탄생할 수 있습니다.
하지만 앞서 말한 것처럼 이런 데이터를 일관성 있게 만드는 일은 쉽지 않습니다. 일단 여러 마리가 뒤엉켜 헤엄치고 있어서 물고기 대다수가 서로에 의해 가려져 있습니다. 전체적인 형태를 파악하기가 힘든 것이죠. 물고기의 유연한 움직임도 문제입니다. 길고 유연한 몸체를 가진 어류일수록 다양한 각도로 휘어져 몸길이를 확인하기 어렵습니다. 당연히 어종과 개체에 따라 달라지는 불규칙적인 모든 움직임을 가이드라인에 전부 소개할 수도 없습니다.
실제 현장에서 활용할 만한 수준의 인공지능을 만들려면 대규모 데이터가 필요하다는 점도 중요합니다. 글로비트는 레이블러를 이용해서 다섯 가지 어종(넙치·조피볼락·참돔·감성돔·돌돔)마다 각 24만 개체, 총 120만 개체를 어노테이션 한 데이터를 구축했는데요. 이처럼 백만 마리 이상의 개체를 레이블링하려면 작업자 모집·교육·관리에 많은 시간과 비용이 들어갑니다.
또한, 실제 작업을 진행하기 전에는 이미지 1장당 몇 마리의 개체가 있을 지 알기 힘들다는 점에서 불필요한 비용이 낭비될 가능성도 있습니다. 일부 어종만 필요한 데이터 수량을 초과하거나 반대로 너무 부족한 상황이 발생할 수 있는 것이죠. 데이터를 대량으로 구축하면서도 자유로운 움직임을 일관성 있게 어노테이션 할 수 있는 방법이 있을까요? 그렇게 할 수 있다면, 데이터 구축에 들어갈 시간과 비용을 절약하여 더 중요한 AI 개발에 집중할 수 있을거예요.
Solution
물고기의 자유로운 움직임을 데이터로 만드는 법
어류 행동 패턴과 같은 대규모 데이터를 구축하려면 수백 명의 어노테이션 작업자가 필요합니다. 바운딩 박스와 폴리 라인을 작업할 수 있을 뿐 아니라, 어류의 다양한 행동 패턴을 보면서 주어진 가이드라인을 기준으로 적절하게 응용할 수 있는 사람이 필요한데요. 레이블러는 20만 명이 활동하는 크라우드 소싱 플랫폼 ‘레이블러 웹 & 모바일 앱’을 통해 나에게 필요한 사람 지능을 빠르게 확보할 수 있습니다.
그중에서도 물고기의 자유로운 움직임을 적절하게 작업할 수 있는 사람은 어떻게 찾을 수 있을까요? 몸 색이 어둡고 납작해서 형태를 파악하기 어려운 넙치와, 색과 형태는 분명하지만 움직임이 빨라 순간 형태가 매우 다양한 돌돔은 다른 어종보다 뛰어난 관찰력과 섬세한 작업이 필요합니다. 참돔을 성공적으로 어노테이션 한 사람이라도 넙치와 돌돔의 작업 품질은 상대적으로 떨어질 수 있는 것이죠. 이처럼 같은 태스크 안에서도 원천 데이터나 작업 유형에 따라 요구되는 능력과 수준이 매우 달라질 수 있습니다.
레이블러 AQC를 사용하면 다양한 요구사항에 적합한 작업자를 매번 찾을 필요 없이, 자격 검증 태스크(Qualification Task)로 사전에 정의된 기준에 따라 자동으로 선발·관리할 수 있습니다. 작업자들은 가이드라인을 숙지하고 초기 자격 검증 태스크를 기준 이상으로 통과해야 본 작업에 참여할 수 있고, 이후에도 랜덤하게 주어지는 수시 검증 태스크를 거쳐야 작업 진행이 가능합니다. 작업을 진행하면서 집중력이 흩어지거나, 불성실한 작업을 제출하는 것을 제한하기 위한 것이죠.
초기 자격 검증을 어느 정도 수준으로 맞춰야 내가 원하는 데이터 품질이 나올 수 있는지 궁금하신가요? 먼저 아주 적은 수량부터 가볍게 시작해 보세요. 소규모로 시작해서 발생 가능한 리스크를 미리 확인하고 조정하면 이후 레이블러 AQC를 통해 수천, 수백만 건 데이터의 퀄리티 컨트롤을 자동으로 진행할 수 있습니다. 어종별 객체 수량도 자동으로 조절이 가능합니다. 미리 설정한 카테고리 비율에 따라 실시간으로 객체 수량을 파악하여 목표량을 넘긴 어종은 더 이상 작업되지 않도록 조정할 수 있는 것이죠. 레이블러의 유연하고 강력한 ‘엘라스틱 워크플로우(Elastic Workflow, EWF)는 1개 태스크를 위해 사람과 AI가 협업하며 최적의 처리 결과를 이끌어냅니다.
한 번의 데이터 구축에서 멈추지 않고 지속적인 인공지능 개발이 필요한가요? 레이블러 브레인 API를 이용해서 실시간으로 발전하는 AI를 만들어보세요. API를 호출하여 나에게 필요한 사람 지능 태스크를 간단하게 처리할 수 있습니다. 레이블러 브레인 API를 AI 제품이나 서비스에 연결하여 태스크를 처리하는 즉시 AI가 학습하도록 만들어보세요.
Result
어류 120만 개체를 일관성 있게 어노테이션하여 ‘우수 과제’로 선정되었습니다.
글로비트는 레이블러를 이용하여 총 126만 개체의 물고기 이미지 데이터를 구축했습니다. 총 371시간의 어류 행동 영상을 사용하여 각 어종별로 24만 개체 이상을 확보했으며, 데이터 종류도 특정 어종에 치우치지 않고 고르게 분포하도록 구성되었습니다. 상대적으로 작업이 수월했던 참돔이나 감성돔은 물론이고, 작업이 어려웠던 넙치와 돌돔도 일관성을 확보하여 좋은 품질의 데이터를 구축할 수 있었습니다.
레이블러를 사용한 어류 행동 패턴 데이터의 한국정보통신기술협회(TTA) 품질 검증 결과는 98.97%로 목표치인 90%를 월등히 초과했습니다. 이를 바탕으로 해당 사업은 2020년 NIA 인공지능 학습데이터 구축 사업 품질 검증 수행 결과 “우수 과제”로 선정되었습니다. 대규모 어노테이션 작업을 위해 수백 명의 사람을 모집하거나 관리할 필요는 없었습니다. 이 과정에서 절약한 시간과 비용은 더 중요한 일에 사용할 수 있습니다. 레이블러는 고객이 누구보다 빠르게 AI 제품과 서비스를 개발하고 출시할 수 있도록 지원하는 AIOps 솔루션을 제공합니다.