U
    <A·fe#  ã                   @   sv   d dl Z d dlZd dlmZmZmZmZmZmZ d dl	Z	d dl	m
Z
 d dlmZmZmZmZmZ G dd„ de
jƒZdS )é    N)ÚAnyÚDictÚListÚOptionalÚTupleÚUnion)Únn)Ú
AutoConfigÚ	AutoModelÚAutoTokenizerÚ	MT5ConfigÚT5Configc                       sP  e Zd ZdZd!eee eeeef  eeeef  eeeef  ee e	eddœ	‡ fdd„Z
ddœdd	„Zddœd
d„Zddœdd„Zedœdd„Zeeejf eeejf dœdd„Zedœdd„Zd"eee ee eeeef  f eee	f eeejf dœdd„Zeeef dœdd„Zd#ee	ddœdd„Zeed dœdd „ƒZ‡  ZS )$ÚTransformera„  Huggingface AutoModel to generate token embeddings.
    Loads the correct class, e.g. BERT / RoBERTa etc.

    Args:
        model_name_or_path: Huggingface models name
            (https://huggingface.co/models)
        max_seq_length: Truncate any inputs longer than max_seq_length
        model_args: Keyword arguments passed to the Huggingface
            Transformers model
        tokenizer_args: Keyword arguments passed to the Huggingface
            Transformers tokenizer
        config_args: Keyword arguments passed to the Huggingface
            Transformers config
        cache_dir: Cache dir for Huggingface Transformers to store/load
            models
        do_lower_case: If true, lowercases the input (independent if the
            model is cased or not)
        tokenizer_name_or_path: Name or path of the tokenizer. When
            None, then model_name_or_path is used
    NF)	Úmodel_name_or_pathÚmax_seq_lengthÚ
model_argsÚtokenizer_argsÚconfig_argsÚ	cache_dirÚdo_lower_caseÚtokenizer_name_or_pathÚreturnc	           
         s  t t| ƒ ¡  ddg| _|| _|d kr*i }|d kr6i }|d krBi }tj|f|d|i—Ž}	| j||	|f|Ž |d k	r‚d|kr‚||d< tj|d k	r’|n|fd|i|—Ž| _	|d krèt
| jdƒrèt
| jjdƒrèt
| j	dƒrèt| jjj| j	jƒ}|| _|d k	r| j	jj| jj_d S )Nr   r   r   Úmodel_max_lengthÚconfigÚmax_position_embeddings)Úsuperr   Ú__init__Úconfig_keysr   r	   Úfrom_pretrainedÚ_load_modelr   Ú	tokenizerÚhasattrÚ
auto_modelr   Úminr   r   r   Ú	__class__Ú__name__Ztokenizer_class)
Úselfr   r   r   r   r   r   r   r   r   ©r$   © úL/tmp/pip-unpacked-wheel-i7fohqg6/sentence_transformers/models/Transformer.pyr       s>    
ÿþý
ÿþ
ý
zTransformer.__init__)r   c                 K   sZ   t |tƒr| j|||f|Ž n8t |tƒr<| j|||f|Ž ntj|f||dœ|—Ž| _dS )zLoads the transformer model©r   r   N)Ú
isinstancer   Ú_load_t5_modelr   Ú_load_mt5_modelr
   r   r"   )r&   r   r   r   r   r(   r(   r)   r   N   s    

ÿ ÿÿzTransformer._load_modelc                 K   s2   ddl m} dg|_|j|f||dœ|—Ž| _dS )úLoads the encoder model from T5r   )ÚT5EncoderModelú	decoder.*r*   N)Útransformersr/   Ú"_keys_to_ignore_on_load_unexpectedr   r"   )r&   r   r   r   r   r/   r(   r(   r)   r,   Y   s    ÿ ÿÿzTransformer._load_t5_modelc                 K   s2   ddl m} dg|_|j|f||dœ|—Ž| _dS )r.   r   )ÚMT5EncoderModelr0   r*   N)r1   r3   r2   r   r"   )r&   r   r   r   r   r3   r(   r(   r)   r-   b   s    ÿ ÿÿzTransformer._load_mt5_modelc                 C   s   d  |  ¡ | jjj¡S )Nz+Transformer({}) with Transformer model: {} )ÚformatÚget_config_dictr"   r$   r%   ©r&   r(   r(   r)   Ú__repr__k   s     ÿzTransformer.__repr__)Úfeaturesr   c                 C   sŽ   |d |d dœ}d|kr&|d |d< | j f |ddi—Ž}|d }| ||d dœ¡ | j jjrŠd	}t|ƒd
k rtd}|| }| d|i¡ |S )z#Returns token_embeddings, cls_tokenÚ	input_idsÚattention_mask)r9   r:   Ztoken_type_idsZreturn_dictFr   )Ztoken_embeddingsr:   é   é   é   Zall_layer_embeddings)r"   Úupdater   Zoutput_hidden_statesÚlen)r&   r8   Ztrans_featuresZoutput_statesZoutput_tokensZall_layer_idxZhidden_statesr(   r(   r)   Úforwardp   s    
zTransformer.forwardc                 C   s
   | j jjS )N)r"   r   Zhidden_sizer6   r(   r(   r)   Úget_word_embedding_dimension…   s    z(Transformer.get_word_embedding_dimensionT)ÚtextsÚpaddingr   c              	   C   sî   i }t |d tƒr|g}nt |d tƒrrg }g |d< |D ]0}tt| ¡ ƒƒ\}}| |¡ |d  |¡ q8|g}n8g g  }}	|D ] }
| |
d ¡ |	 |
d ¡ q€||	g}dd„ |D ƒ}| jrÌdd„ |D ƒ}| | j	||dd| j
d	œŽ¡ |S )
z-Tokenizes a text and maps tokens to token-idsr   Z	text_keysr=   c                 S   s   g | ]}d d„ |D ƒ‘qS )c                 S   s   g | ]}t |ƒ ¡ ‘qS r(   )ÚstrÚstrip©Ú.0Úsr(   r(   r)   Ú
<listcomp>Ÿ   s     ú3Transformer.tokenize.<locals>.<listcomp>.<listcomp>r(   ©rG   Úcolr(   r(   r)   rI   Ÿ   s     z(Transformer.tokenize.<locals>.<listcomp>c                 S   s   g | ]}d d„ |D ƒ‘qS )c                 S   s   g | ]}|  ¡ ‘qS r(   )ÚlowerrF   r(   r(   r)   rI   £   s     rJ   r(   rK   r(   r(   r)   rI   £   s     Zlongest_firstÚpt)rC   Z
truncationZreturn_tensorsÚ
max_length)r+   rD   ÚdictÚnextÚiterÚitemsÚappendr   r>   r    r   )r&   rB   rC   ÚoutputZto_tokenizeÚlookupZtext_keyÚtextZbatch1Zbatch2Z
text_tupler(   r(   r)   Útokenizeˆ   s:    

ûÿ	zTransformer.tokenizec                    s   ‡ fdd„ˆ j D ƒS )Nc                    s   i | ]}|ˆ j | “qS r(   )Ú__dict__)rG   Úkeyr6   r(   r)   Ú
<dictcomp>±   s      z/Transformer.get_config_dict.<locals>.<dictcomp>)r   r6   r(   r6   r)   r5   °   s    zTransformer.get_config_dict)Úoutput_pathÚsafe_serializationr   c              	   C   sT   | j j||d | j |¡ ttj |d¡dƒ}tj|  	¡ |dd W 5 Q R X d S )N)r]   úsentence_bert_config.jsonÚwr;   )Úindent)
r"   Zsave_pretrainedr    ÚopenÚosÚpathÚjoinÚjsonÚdumpr5   )r&   r\   r]   ZfOutr(   r(   r)   Úsave³   s    zTransformer.save)Ú
input_pathr   c              	   C   s¾   dD ]"}t j | |¡}t j |¡r q(qt|ƒ}t |¡}W 5 Q R X d|krhd|d krh|d  d¡ d|krŠd|d krŠ|d  d¡ d|kr¬d|d kr¬|d  d¡ tf d| i|—ŽS )N)r^   zsentence_roberta_config.jsonzsentence_distilbert_config.jsonzsentence_camembert_config.jsonzsentence_albert_config.jsonz sentence_xlm-roberta_config.jsonzsentence_xlnet_config.jsonr   Ztrust_remote_coder   r   r   )	rb   rc   rd   Úexistsra   re   ÚloadÚpopr   )rh   Zconfig_nameZsbert_config_pathZfInr   r(   r(   r)   rj   º   s    	
zTransformer.load)NNNNNFN)T)T)r%   Ú
__module__Ú__qualname__Ú__doc__rD   r   Úintr   r   Úboolr   r   r,   r-   r7   ÚtorchZTensorr@   rA   r   r   r   rX   r5   rg   Ústaticmethodrj   Ú__classcell__r(   r(   r'   r)   r   
   sF          ÷ö.		$ ÿ  
þ(r   )re   rb   Útypingr   r   r   r   r   r   rq   r   r1   r	   r
   r   r   r   ÚModuler   r(   r(   r(   r)   Ú<module>   s    