boostcamp

    최종 프로젝트 회고

    (블로그를 이동해 작성 날짜가 맞지 않는 점 참고해주세요!) 1. 프로젝트 지난주에 발표 영상과 발표 자료를 제출하고, 최종 프로젝트가 끝났다!!!! 우리 팀 주제는 “회의록을 활용한 질의응답(Question Answering)”으로 사용자가 회의록을 업로드하고, 궁금한 점을 질문하면, 답변해주는 서비스이다. 네이버에서 제공하는 클로바노트는 음성 기록 관리 서비스로, 모든 것을 받아적기 어려운 회의 내용을 저장하고 수월하게 복기할 수 있도록 도와준다. "이렇게 저장된 회의 데이터를 활용하는 서비스를 만들 수 있지 않을까?" 하는 생각으로부터 프로젝트를 시작했다. 초반에 브레인스토밍 했던 주제는 상품 이미지를 넣으면 마케팅 메시지를 생성해주는 것이었는데 상품 이미지-마케팅 메시지로 쌍을 이루는 데이터셋을 ..

    MRC 대회 회고

    (블로그를 이동해 작성 날짜가 맞지 않는 점 참고해주세요!) 1. 프로젝트 Level 2의 마지막 대회인 Open-domain Question Answering 대회가 끝났다. 👏👏👏 Question Answering(질의응답)은 정답이 들어있는 지문(context)과 질문(question)이 주어지면 질문에 대한 정답(answer)을 찾는 task이다. 정답을 찾을 때 지문 내에 들어있는 문장으로만 정답을 구성하는 extractive 방식과 문단에 없는 어휘로 구성하는 generative 방식이 있다. 이번 대회는 extractive 방식이었으며, 모델이 지문을 읽고 이해해야 하므로 MRC(Machine Reading Comprehension)라고 부르기도 한다. 여기서 앞에 open-domain이 붙..

    RE 데이터 제작 회고

    (블로그를 이동해 작성 날짜가 맞지 않는 점 참고해주세요!) Level 2의 두 번째 대회인 RE 데이터 제작 대회가 끝났다. 이번 대회는 팀별로 리더보드 점수를 높이는 것이 아니라, 팀별 주제에 맞게 주어진 텍스트 데이터로 관계추출(Relation Extraction) 데이터를 구축하는 것이 목표였다. 이번에는 변성윤 마스터님께서 소개해주신 KPT 회고에 따라 작성해 보았다. 1. 프로젝트 위키피디아에서 러시아-우크라이나 전쟁 키워드로 수집한 데이터로 관계 추출(Relation Extraction) 데이터셋을 구축했다. KLUE 관계추출 데이터를 기반으로 주제로 정한 텍스트 데이터에 맞게 relation map을 정의하고 tagging을 진행하기 위한 guideline을 작성했다. 프로젝트 정리 링크:..

    KLUE 관계 추출 대회 회고

    (블로그를 이동해 작성 날짜가 맞지 않는 점 참고해주세요!) Level 2의 첫 번째 대회인 KLUE 관계 추출 대회가 끝났다. 팀 단위로 랩업 리포트와 깃허브에 담지 못한, 팀 전체 의견으로는 담기 어려운 개인적인 내용을 위주로 회고를 작성해 보았다. 지난 대회와 비교해 성장한 부분 🔥 이번 대회에서 가장 발전한 점과 우리 팀의 강점을 뽑으면 협업이다. 지난 대회에서는 리더보드 점수에 굉장히 신경썼다면, 이번 대회에서는 리더보드 점수보다는 ‘근거를 기반으로 가설 설정하고 실험하기'와 ‘제대로 된 협업하기’에 초점을 두고 진행했다. 팀원 모두 Level1 대회에서 협업 측면에서 아쉽다고 느껴 대회 시작하기 전 따로 시간을 내어 그라운드 룰을 설정하고 협업 툴도 세팅했다. 1. 협업 툴 지금 team gr..