'내가 만드는 온라인 대화 말뭉치' 프로젝트 


당신의 수다가 더해주는 일상 언어의 가치

이제는 우리의 일상이 되어버린 메신저 대화,


우리의 온라인 메신저 언어 생활을 연구하며,

인공지능 연구와 개발에 필요한 데이터를 위해 

당신의 수다가 절실히 필요합니다.


'2021년 온라인 대화 자료 수집 및 정제' 사업

(통칭 '내가 만드는 온라인 대화 말뭉치 프로젝트')

4차 산업혁명과 인공지능 시대를 대비해

일상 속 온라인 대화를 언어 연구에 사용하고,

가치 있는 데이터로 만드는 프로젝트입니다.


국립국어원인공지능 학습 데이터 전문 기업


그리고 당신이 함께 합니다.

#인공지능 #비대면시대 #챗봇 #MZ세대 #말뭉치 #국립국어원

말뭉치란?


다양한 목적으로 활용되는 대규모 언어 데이터

당신은 어떻게 '말'을 배웠나요? 


태어나자마자 부모님과 가족들이 나에게 들려준 따뜻한 말들,

친구들과 어울리며 자연스럽게 배운 말들...

일상 생활 속에서 무수히 많은 말을 접하면서 

스스로 말을 사용하는 방법을 배웠을 거예요. 


언어를 사용하는 원리를 밝히거나,

다양한 목적으로 사용하기 위해서는 

대규모의 언어 데이터가 필요합니다. 

이런 데이터를 '말뭉치' 또는 '코퍼스(corpus)'라고 합니다. 


말뭉치는 컴퓨터를 이용해 언어를 연구하거나,

인공지능을 연구하고 개발하는 데에도 사용되는

조금 특이한 모양의 데이터지만, 

말뭉치를 만드는 재료는 여러분이 일상에서 사용하는 '말'입니다. 


당신이 바로 말뭉치를 만드는 사람이고, 

인공지능에게 '말'을 가르치는 부모이자 친구입니다.

#corpus #말뭉치 #콩심은데콩나고팥심은데팥난다

본 사업에서는 다음과 같은 내용이 포함된 대화는 말뭉치로 만들지 않습니다 :

1. 심한 욕설

2. 특정 성향 및 인종 등에 대한 차별이나 혐오 여지가 있는 발언

3. 반사회적 행동

4. 범죄 모의

5. 그 외 사회적인 문제가 될 수 있는 발언

참여 기관


국립국어원 (주관 기관)

한국어와 한글, 세계로 힘차게 뻗어 나가는 언어로 가꾸다

국립국어원은 국어를 발전시키는 정책을 수립하고 시행하기 위해 설립된 국가 기관입니다. 

국민의 바른 언어생활을 선도하는 다양한 언어 정책 연구와 연구 사업을 수행합니다.

사업 담당 : 국립국어원 언어정보과 학예연구사 유희정 (02)2669-9638


(주) 미디어 코퍼스

- '나심비' 인기 상품 찾아 줘.
- 네, 잠시만 기다려 주세요.

인공지능 스피커나 챗봇에게 말을 걸어 보셨나요? 

가끔(종종) 당신의 말을 못 알아듣기도 하죠.


인공지능이 못 알아듣는 단어나 표현이 없도록, 

당신의 말을 더 잘 이해하도록


말뭉치를 만듭니다.


(주) 다이얼로그 디자인 에이전시

인공지능의 대화에 숨결 불어 넣기

요즘은 인공지능 스피커가 랩도 하고, 

비트박스에 끝말잇기도 하고 

당신의 짓궂은 질문에도 센스있게 대답하죠. 


인공지능의 대화 스타일을 디자인하고,

인공지능이 생동감 있게 대화하도록


말뭉치를 만듭니다.


심심이 (주)

'태초에 심심이가 있었다.'

아직 '챗봇'이라는 단어도 생소하던 2002년, 

세계 최초의 일상 대화 챗봇을 서비스한 '심심이'


독보적인 다양성, 재미, 생동감을 주는 챗봇으로

심심한 사람의 말동무, '심심이'를 서비스합니다.

 2021 온라인 대화 자료 수집 및 정제 사업단

- 주관 : 문화체육관광부 국립국어원

- 참여사 : (주)미디어 코퍼스, (주)다이얼로그 디자인 에이전시, 심심이(주)


Copyright ⓒ 2020 mediaCORPUS. All Rights Reserved. 

ISO 9001

ISO 27001