
01
02
03
04
05
챗봇을 위한 대화 데이터 어노테이션
유형: 대화 어노테이션
디바이스: PC
수량: 120만
챗봇과 사람의 대화를 읽고 세부 주제를 레이블링하는 프로젝트입니다. 딥네츄럴은 전체적인 대화 맥락과 개별 발화를 동시에 확인해야하는 대화 어노테이션의 특성에 맞는 저작도구를 제작하여 작업 효율을 높였습니다. 정해진 정답이 있기보다는 맥락에 의존하는 대화 어노테이션은 1개의 태스크를 여러 사람에게 맡겨 평가하는 방식으로 작업 신뢰도를 향상시킬 수 있습니다.
영어 문장 분석을 위한 오디오 전사 및 구간 평가
유형: 음성 전사, 음성 세그멘테이션
디바이스: PC
수량: 1만
내가 녹음한 영어 문장에 대해 AI가 평가·분석해주는 서비스 개발을 위해 뉴스 음성 전사, 영어 문장 평가, 문장 구간 분리 등의 작업이 진행되었습니다. 20만 명 이상의 작업자가 활동하는 딥네츄럴의 크라우드 소싱 플랫폼 ‘레이블러’에서는 영어·일본어 등의 외국어 능력을 갖춘 어학 전문가, 심전도 확인이 가능한 의료 전문가 등 나에게 필요한 사람 지능을 손쉽게 찾을 수 있습니다.
미소 사진 수집 및 AI 엔진 개발
유형: 이미지 수집, AI 엔진 개발
디바이스: Mobile
수량: 3.8만
모바일로 미소 사진을 수집하고 행복도를 레이블링한 프로젝트로, 딥네츄럴에서 수집과 AI 엔진 개발을 함께 진행했습니다. 딥네츄럴의 AI Assistant ‘레이(Lay)’는 이미지 유사도 측정 알고리즘으로 수십만 장의 이미지 속에서 동일하거나 유사한 이미지를 자동 제거하며, 레이블러 EWF는 카테고리별 수량을 자동 조정합니다. AI API를 생성하여 AI 제품이나 서비스에 연동할 수도 있습니다. 수집부터 AI 엔진 개발까지, 딥네츄럴에서 쉽고 빠르게 진행해보세요.
필터링이 필요한 댓글 분류
유형: 텍스트 분류
디바이스: PC
수량: 영어 30만 문장, 한국어 50만 문장
영어와 한국어를 포함하여 총 80만 문장의 방대한 양의 데이터가 성공적으로 구축되었습니다. 온라인상에서 문제가 될 만한 문장을 구분하려면 맥락을 읽을 줄 아는 능력과 함께 사회·문화적 배경 지식이 필요합니다. 딥네츄럴의 레이블러 EWF와 AQC는 사전에 정의된 자격 검증 태스크를 통과한 사람에게만 작업을 할당하고, 1개 태스크를 여러 사람이 작업·평가하여 안정적으로 데이터 품질을 보장합니다.
심리 검사를 위한 일기 수집 및 태깅
유형: 텍스트 수집, 감정 분류
디바이스: PC
수량: 3만
코로나19에 따른 심리 면역력 증진용 AI를 위해 일기 형식의 텍스트 수집과 감정 분류 작업이 진행되었습니다. 장문의 텍스트를 수집할 때, 너무 비슷한 내용의 글만 수집되지 않을까 걱정되시나요? 중복되거나 패턴이 유사한 데이터는 딥네츄럴의 AI Assistant ‘레이(Lay)’를 통해 자동으로 필터링하고, 맞춤법 검사기 API를 사용하여 보완할 수 있습니다. NIA 학습 데이터 구축 사업에서만 70만 건 이상의 텍스트 생성 프로젝트를 진행한 딥네츄럴에 맡겨 주세요.
특정 대상에 대한 댓글 태도 분류
유형: 텍스트 분류
디바이스: PC
수량: 32만
댓글 자동 분류 AI 개발을 위해, 댓글의 태도를 긍/부정으로 레이블링하는 프로젝트입니다. 딥네츄럴의 레이블러 EWF는 텍스트 분류 태스크에서 개인 주관에 따른 편향성을 방지하기 위해 자격이 검증된 작업자 2인 혹은 3인의 의견 일치로 결과물을 생성하고, 불일치 건은 추가 검수를 자동 진행하여 품질을 관리합니다. 장기적인 데이터 구축이 필요하신가요? API를 호출하는 간단한 방식으로, 데이터바우처를 통해 개발한 저작도구와 워크플로우를 그대로 이용하면서 온디맨드로 데이터를 구축해보세요.