솔루션 소개

VAIV의 언어모델인 VAIVGeM은 국내 최고 수준의 한국어 특화 초거대 언어모델로, 응용 지향적이고, 공공기관, 도서관, 금융 등 도메인에 특화된 LLM을 제공합니다.

  • #초거대
  • #언어모델
  • #국내최고
  • #응용지향적
  • #LLM
VAIV
  • 응용 지향적 LLM

    • 태스크 맞춤형 instruction 생성 및 학습
    • 검색 기반 모델과 결합한 생성형 기술로 환각 현상을 최소화한 다중 문서 요약 수행
    • 데이터 요약 기능 및 각종 문서 작성 기능 향상을 위한 맞춤 instruction 학습
  • 도메인 전문적 LLM

    • 공공기관, 도서관, 행정 문서 등 다양한 전문 도메인의 데이터 학습
    • 금융 도메인에 관련된 다량의 데이터 학습
    • 텍스트 외 그래프, 표 등 경제/공공 부문 다양한 비정형 데이터 처리 및 이해 기능 향상
  • 한국어 특화 LLM

    • 한국어의 특성을 반영한 독자적인 instruction 생성 및 학습 (Wizard 방식)
    • 거대 한국어 코퍼스 기반 튜닝
    • 한국어의 모든 음절을 OOV 없이 강건하게 처리 가능한 BBPE tokenizer 기반 학습
  • 강화학습 기반 LLM

    • 사용자의 의도에 부합하는 답변 생성을 위한 instruction-following 모델
    • 생성한 답변에 대한 사람의 피드백 점수를 reward model로 학습
    • 사용자 만족도 점수가 높은 출력을 생성하도록 policy model 최적화