데이터 사이이언스 / AI 전문가가 되는 부담없는 첫 시작
지금 메타코드와 함께 시작해보실래요?

    커뮤니티 5천만 전국민 무료코딩교육의 신화! 메타코드

      커뮤니티

      커뮤니티 > 강의 질문
      강의 질문
      [ 유료 전환 예정 ] 자연어처리 입문강의ㅣ서울대 AI 박사 (자연어처리 입문 - 제 1편)
      # # #
      2024-04-27 20:28:25
      추천 0 답변 1 조회 19

      1. 질문 부분 시간 입력 :

      2. 질문 내용 : 

       

      인코딩(Encoding), 임베딩(Embedding), 벡터화(Vectorization) 용어가 헷갈립니다.

      세 가지 용어가 같은 의미인지요? 만약 그렇지 않다면 어떤 차이가 있는지 궁금합니다. (정의 및 차이점, 예시 등을 들어서 설명 부탁드립니다.)

      누노 등급 : 실버
      커뮤니티 > 강의 질문
      답변
      Re : [ 유료 전환 예정 ] 자연어처리 입문강의ㅣ서울대 AI 박사 (자연어처리 입문 - 제 1편)
      2024-05-06 01:25:01
      추천 1

      [강의 선생님.답변 전달드립니다]

       

      - 인코딩은 데이터를 변환하는 과정을 뜻합니다. 텍스트 데이터를 숫자 (기계어 0과 1의 조합)으로 변환하는 과정은 인코딩입니다. 또한 텍스트를 기계어보다 높은 정수 (0, 1, 2, 3, ...)로 일대일 대응시키는 것도 인코딩입니다.

      - 임베딩은 인코딩의 하위 개념입니다. 텍스트 데이터를 "고차원 공간의 벡터로 변환"하는 것을 의미합니다. 이 고차원 공간의 벡터에서는, 서로 "유사한 의미를 지닌 단어는 유사한 벡터로 변환됩니다"

      - 벡터화는 데이터를 벡터 형식으로 변환하는 것을 의미하며, 자연어 텍스트 뿐 만 아니라 이미지, 논리 등 다른 분야에서도 폭넓게 사용되는 용어입니다. 임베딩은 벡터화의 한 종류입니다.

      즉, 세 용어가 같은 의미도 아니고, 서로 포함하거나 포함되는 관계도 아닌, 다른 종류의 의미들입니다.

      관리자 등급 : 관리자
      30대 대기업
      경력 5년
      AI 전공
      지금, 메타코드와 시작해보세요.