본문 바로가기
Computer Science/딥러닝

[발전양상] 파운데이션 모델과 생성형 AI

by 예스p 2024. 9. 25.

딥러닝 발전 양상

24-09-24에 진행되었던 에티버스의 AWS 워크샵에 기반한다.


 

포스팅순서

  1. 기반지식 : 학습방법론
    - 지도학습
    - 비지도학습
    - 강화학습
  2. 기반지식 : 관련용어
    - 사전학습
    - 파인튜닝
  3. 파운데이션 모델(FM, Foundation Model)
  4. 생성형 AI (Generative AI)
  5. 인공지능 in AWS
    - 배드락(Bedrock)
    - 세이지메이커(SageMaker)

 

기반지식 : 학습방법론

  • 지도학습 (Supervised Learning)
    - 입력값(데이터)과 결과값(라벨)을 함께 주고 학습을 시키는 것
    - 특징(feature)들을 직접 추출하고 분류작업을 한다.
    - 알려주지 않은 문제에 대해 답을 알려주지 못함
  • 비지도학습 (Unsupervised Learning)
    - 입력값에 대해 결과를 알려주지 않고 학습을 시키는 것
    - 기계가 직접 특징들을 추출하고 관리한다.
      이 과정은 사람이 열어봐도 이해를 하기 어려움
  • 강화학습 (Reinforcement Learning)
    - 보상을 최대화 하기 위해 최적의 행동을 학습하는 방법론
    - 알파고, 자율주행 자동차 등이 여기에 해당한다.

머신러닝 프로세스



 

기반지식 : 관련용어

  • 사전학습 (Pre-training)
    - 모델이 일반적인 패턴이나 지식을 학습하도록 하는 것
    - 특정 작업에 국한되지 않고 다양한 데이터셋에서 기본적인 특징을 배운다
  • 파인튜닝 (Fine-Tuning)
    - 사전에 학습된 모델에 대해 레이블이 있는 데이터셋을 학습시키는 것
    - 특정 작업에 대한 성능을 높이기 위한 기법
    - 지도학습의 일종

 


파운데이션 모델(FM, Foundation Model)

  • 딥러닝이 발전하면서 등장하게 된 모델군
  • 탄생배경
    - 기존의 모델들은 지도학습을 통해 특정작업은 굉장히 잘하지만 다른작업은 못함
    >> 인터넷의 방대한 원시 데이터를 비지도 학습시킴
    >> 다방면의 테스크를 보편적으로 잘하는 특성을 가진 파운데이션 모델 탄생
  • 특징
    - 다방면의 일을 보편적으로 잘 처리한다
    - 특정 도메인에 대한 능력을 강화시켜 다운스트림 작업을 수행시킬 수 있다
      * 다운스트림(downstream) : FM이 특정 작업이나 어플리케이션에 적용되는 과정
    - 방대한 데이터가 필요하며, 학습을 위해 필요한 리소스의 규모도 크다.(고비용)
  • 프로바이더
    - FM을 개발한 후 API, 오픈소스 등의 형태로 배포하는 주체
    - OpenAI, Google, Meta(구 Facebook) 등이 있다.

 


생성형 AI (Generative AI)

  • 주어진 입력 데이터 또는 조건을 기반으로 새로운 데이터를 생성하는 인공지능 기술
  • 주로 딥러닝 기술을 사용해서 구현된다.
  • 일반적으로 파운데이션 모델을 기반으로 개발하여의 효율성과 효과성을 극대화한다
    >> FM별로 특화분야가 있어 자신의 Usecase에 적합한 모델을 찾는것도 중요한 과정이다
  • Chat GPT
    - 자연어 데이터를 생성하는 대표적인 생성형 AI
    - Transformer 구조를 기반으로 한다.
    - 보편성을 가졌기 때문에 파운데이션 모델이기도 하다.

 

 

인공지능 in AWS

  • 배드락(Bedrock)
    - AWS의 AI 서비스 개발 플랫폼
    - 다양한 파운데이션 모델을
    API 기반으로 편리하게 사용할 수 있다
      >> 생성형 AI 개발 가속화
    - 컨슈머 및 튜너에게 적합한 상품
      (컨슈머 : 딥러닝 모델을 직접 개발하지 않으면서 이를 어플리케이션에 활용하는 주체)
    - FM을 재학습 또는 파인튜닝 할 수 있다.
    - 인터넷 통신을 하는 경우 관련된 보안대책은 주체가 직접 구축해야함
      (프라이빗 서버라면 NAT게이트웨이를 사용하면됨
    - invoke함수로 모델들을 호출하는데, 모델별 인터페이스를 통일하고 싶다면 LangChain 프레임워크를 활용할 수 있다.(converse함수는 아직 다양한 모델에 적용하지 못함)
    - 실습링크 : https://AWS.Bedrock
      >> PartyRock을 통해 무료로 실습해볼 수 있다
  • 세이지메이커(SageMaker)
    - 기계 학습 모델을 구축, 학습, 배포하는 데 도움을 주는 관리형 서비스
    - 배드락에 비해 좀더 운영관리에 세세한 기능들을 제공한다
      (전문지식이 필요한 대신 많은 부분을 컨트롤할 수 있음)
    - 프로바이더들에게 적합한 상품

 

 

 

 

 

 

 

댓글