MODEL CONSTRUCTING METHOD FOR IMAGE-TEXT RETRIEVAL MODEL AND SERVICE APPARATUS
이미지-텍스트 검색 모델 구축 방법.은 학습장치는 학습데이터 중 이미지 및 텍스트 쌍을 선택하고, 상기 이미지를 이미지 인코더에 입력하고, 상기 텍스트를 텍스트 인코더에 입력하는 단계, 상기 학습장치는 상기 이미지 인코더와 상기 텍스트 인코더에 대한 ITC(image-text contrastive learning)를 수행하는 단계, 상기 학습장치는 상기 이미지 인코더가 출력하는 이미지 임베딩을 입력받는 제1 크로스 모달 인코더에 대한 MIM(Masked Image Modeling)을 수행하는 단계, 상기 학습장치는 상기 텍스트 인코...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 이미지-텍스트 검색 모델 구축 방법.은 학습장치는 학습데이터 중 이미지 및 텍스트 쌍을 선택하고, 상기 이미지를 이미지 인코더에 입력하고, 상기 텍스트를 텍스트 인코더에 입력하는 단계, 상기 학습장치는 상기 이미지 인코더와 상기 텍스트 인코더에 대한 ITC(image-text contrastive learning)를 수행하는 단계, 상기 학습장치는 상기 이미지 인코더가 출력하는 이미지 임베딩을 입력받는 제1 크로스 모달 인코더에 대한 MIM(Masked Image Modeling)을 수행하는 단계, 상기 학습장치는 상기 텍스트 인코더가 출력하는 텍스트 임베딩을 입력받는 제2 크로스 모달 인코더에 대한 MLM(Masked Language Modeling)을 수행하는 단계 및 상기 학습장치는 상기 제1 크로스 모달 인코더가 출력하는 이미지 임베딩과 상기 제2 크로스 모달 인코더가 출력하는 텍스트 임베딩에 대한 ITM (Image-Text Matching) 학습을 수행하는 단계를 포함한다. |
---|