본문 바로가기

Korean

비디, ChatGPT 시대에 ‘초거대 AI 사전 학습용 헬스케어 질의응답 데이터’ 구축

반응형
올해 열린 NIA ‘초거대AI 데이터 구축 착수보고회’ 모습 / 이미지제공 : 비디
올해 열린 NIA ‘초거대AI 데이터 구축 착수보고회’ 모습 / 이미지제공 : 비디

ChatGPT의 등장으로 올해 초부터 생성형 인공지능(AI)에 대한 관심이 뜨겁다. 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)에서 추진하고 있는 ‘AI 학습용 데이터 구축 사업’도 이러한 변화에 따라 초거대 AI를 위한 고품질·대규모 데이터 구축을 중심으로 사업이 추진되고 있다.

정보통신기술(ICT) 서비스 및 플랫폼 개발 전문 기업인 비디(대표 김기용, 독고세준, 이상명)는 올해 ‘초거대 AI’ 영역 자유공모를 통해 ‘초거대 AI 사전학습용 헬스케어 질의응답 데이터’ 구축 과제를 제안했고, 기술과 수행 역량의 우수성을 인정받아 데이터 구축 사업자로 선정돼 관련사업을 진행하고 있다고 밝혔다.

비디는 2020년 부터 ‘AI 학습용 데이터 구축 사업’에 참여해 올해로 4년째를 맞고 있으며, ‘데이터 수집·정제·가공 처리 도구’와 ‘데이터 수집 공정관리 플랫폼’에 대해 축적된 기술을 기반으로 사업에 기여하고 있다.

특히 이번 과제에서는 데이터 구축에 필요한 ‘데이터 수집·정제·가공 처리 도구’에 ‘초거대 AI’ 구축을 위한 단계별 데이터 처리 효율화 기술, 대량 데이터 분산 처리 기술 등을 적용했다.

또한 ‘데이터 수집 공정관리 플랫폼’은 오디오/프리텍스트/센싱데이터 등과 같이 다양한 유형의 데이터들을 수집, 정제, 흐름 제어하는 과정에서 실시간 모니터링은 물론 작업자별 공정 수치를 시각화함으로써 데이터 품질을 보증할 수 있도록 했다.

김용목 비디 전무는 “생성형 AI에 대한 기대가 큰 상황에서 해당 과제를 수행할 수 있어서 기쁘게 생각한다”며 “자체 기술로 확보된 ‘구문 정확성 검증 도구’와 ‘대화 데이터 정제 가공’ 솔루션을 적극적으로 활용해 데이터 품질을 확보함으로써 AI 모델 성능 향상에 기여할 것”이라고 밝혔다.

반응형
LIST