NLP201

글

8월, 2022의 게시물 표시

lassl을 이용한 언어모델 사전학습 (Feat. T5, UL2)

- 8월 27, 2022

업데이트 [22/10/4] 모두의말뭉치 + alpha로 학습한 KoUL2 모델을 huggingface hub 에 릴리즈했습니다! ---------------------------------------- 이 포스트에서는 lassl 오픈소스를 사용해서 실제로 한국어 코퍼스를 활용한 사전학습 모델을 만드는 법을 다룹니다. 제가 참여해서 구현한 T5와 UL2의 구현 방식, 고민한 내용들을 공유하고자 합니다. Lassl 소스코드는 여기 에서 확인하실 수 있습니다. TFRC 프로그램 소개 및 신청하기 1. 다음 사이트에 가서 TRC 프로그램의 form을 작성하고 신청합니다. https://sites.research.google/trc/about/ 2. 며칠 지나면 다음과 같은 메일이 옵니다. 3. console.cloud.google.com에서 프로젝트를 생성한 뒤 그 프로젝트 ID를 메일 내 링크를 통해 입력하면 됩니다. 그러면 다음과 같은 승인 메일이 며칠 내에 옵니다. 4. 이제 TPU instance를 무료로 사용할 수 있습니다! GCP TPU 인스턴스와 디스크 만들기 1. 첫 번째 단계로 gcloud cli를 설치해야 합니다. 해당 내용은 플랫폼 별로 자세하게 설명되어 있으니 여기 를 참조해주세요. 다만 아래에 설명하는 명령어들은 Unix 계열이기 때문에 Window를 사용하시는 경우 WSL이나 도커를 활용하시는 것이 따라하시기 편할 것 같습니다. 2. 다음 명령어로 디스크와 tpu 인스턴스를 생성합니다. 디스크는 선택사항이지만 편하게 쓰려면 붙이시면 좋습니다. 사용 시 경험상 매일 1000원 안팎으로 청구됩니다. 다만 기본 인스턴스에도 100GB가 있기 때문에 잘 아껴 쓰면 디스크를 붙이지 않아도 됩니다. export GCP_DISK_NAME=lassl-disk export GCP_INSTANCE_NAME=lassl-tpu export GCP_PROJECT=<your_project_id> # i.e. fast...

자세한 내용 보기

이 블로그 검색

NLP201

글

From In-context learning to RLHF (Feat. ChatGPT)

lassl을 이용한 언어모델 사전학습 (Feat. T5, UL2)