U
    <A·fÏ  ã                   @   sv   d dl Z d dlZd dlZd dlmZ d dlmZmZmZm	Z	 d dl
mZ erXd dlmZ e e¡ZG dd„ deƒZdS )é    N)Únullcontext)ÚTYPE_CHECKINGÚDictÚListÚOptional)ÚSentenceEvaluator)ÚSentenceTransformerc                	       sn   e Zd ZdZdee ee eeeeee dœ‡ fdd	„Z	ddee
eef dœdd„Zeedœdd„ƒZ‡  ZS )ÚMSEEvaluatora
  
    Computes the mean squared error (x100) between the computed sentence embedding
    and some target sentence embedding.

    The MSE is computed between ||teacher.encode(source_sentences) - student.encode(target_sentences)||.

    For multilingual knowledge distillation (https://arxiv.org/abs/2004.09813), source_sentences are in English
    and target_sentences are in a different language like German, Chinese, Spanish...

    Args:
        source_sentences (List[str]): Source sentences to embed with the teacher model.
        target_sentences (List[str]): Target sentences to embed with the student model.
        teacher_model (SentenceTransformer, optional): The teacher model to compute the source sentence embeddings.
        show_progress_bar (bool, optional): Show progress bar when computing embeddings. Defaults to False.
        batch_size (int, optional): Batch size to compute sentence embeddings. Defaults to 32.
        name (str, optional): Name of the evaluator. Defaults to "".
        write_csv (bool, optional): Write results to CSV file. Defaults to True.
        truncate_dim (int, optional): The dimension to truncate sentence embeddings to. `None` uses the model's current truncation
            dimension. Defaults to None.

    Example:
        ::

            from sentence_transformers import SentenceTransformer
            from sentence_transformers.evaluation import MSEEvaluator
            from datasets import load_dataset

            # Load a model
            student_model = SentenceTransformer('paraphrase-multilingual-mpnet-base-v2')
            teacher_model = SentenceTransformer('all-mpnet-base-v2')

            # Load any dataset with some texts
            dataset = load_dataset("sentence-transformers/stsb", split="validation")
            sentences = dataset["sentence1"] + dataset["sentence2"]

            # Given queries, a corpus and a mapping with relevant documents, the InformationRetrievalEvaluator computes different IR metrics.
            mse_evaluator = MSEEvaluator(
                source_sentences=sentences,
                target_sentences=sentences,
                teacher_model=teacher_model,
                name="stsb-dev",
            )
            results = mse_evaluator(student_model)
            '''
            MSE evaluation (lower = better) on the stsb-dev dataset:
            MSE (*100):  0.805045
            '''
            print(mse_evaluator.primary_metric)
            # => "stsb-dev_negative_mse"
            print(results[mse_evaluator.primary_metric])
            # => -0.8050452917814255
    NFé    Ú T)Úsource_sentencesÚtarget_sentencesÚshow_progress_barÚ
batch_sizeÚnameÚ	write_csvÚtruncate_dimc	           	   	      sŽ   t ƒ  ¡  || _| jd kr tƒ n
| | j¡ |j|||dd| _W 5 Q R X || _|| _|| _	|| _
d| d | _dddg| _|| _d| _d S )	NT©r   r   Zconvert_to_numpyZmse_evaluation_z_results.csvÚepochÚstepsZMSEÚnegative_mse)ÚsuperÚ__init__r   r   Útruncate_sentence_embeddingsÚencodeÚsource_embeddingsr   r   r   r   Úcsv_fileÚcsv_headersr   Zprimary_metric)	Úselfr   r   Zteacher_modelr   r   r   r   r   ©Ú	__class__© úQ/tmp/pip-unpacked-wheel-i7fohqg6/sentence_transformers/evaluation/MSEEvaluator.pyr   E   s&    
ÿ   ÿzMSEEvaluator.__init__éÿÿÿÿr   )ÚmodelÚoutput_pathÚreturnc              	   C   s|  |dkr0|dkrd|› }q4d|› d|› d}nd}| j d k	rP|d| j › d7 }| j d kr`tƒ n
| | j ¡ |j| j| j| jd	d
}W 5 Q R X | j| d  ¡ }|d9 }t	 
d| j› d|› d¡ t	 
d |¡¡ |d k	rT| jrTtj || j¡}tj |¡}	t|d|	rdnddd2}
t |
¡}|	s:| | j¡ | |||g¡ W 5 Q R X d| i}|  || j¡}|  ||¡ |S )Nr#   z after epoch z
 in epoch z after z stepsr   z (truncated to ú)Tr   é   éd   z'MSE evaluation (lower = better) on the z datasetú:zMSE (*100):	{:4f}ÚaÚwzutf-8)ÚnewlineÚmodeÚencodingr   )r   r   r   r   r   r   r   r   ZmeanÚloggerÚinfor   Úformatr   ÚosÚpathÚjoinr   ÚisfileÚopenÚcsvÚwriterÚwriterowr   Zprefix_name_to_metricsZ store_metrics_in_model_card_data)r   r$   r%   r   r   Zout_txtZtarget_embeddingsZmseZcsv_pathZoutput_file_existsÚfr9   Zmetricsr!   r!   r"   Ú__call__c   s<    
ü

zMSEEvaluator.__call__)r&   c                 C   s   dS )NzKnowledge Distillationr!   )r   r!   r!   r"   ÚdescriptionŒ   s    zMSEEvaluator.description)NFr
   r   TN)Nr#   r#   )Ú__name__Ú
__module__Ú__qualname__Ú__doc__r   ÚstrÚboolÚintr   r   r   Úfloatr<   Úpropertyr=   Ú__classcell__r!   r!   r   r"   r	      s&   9      ÷÷)r	   )r8   Úloggingr3   Ú
contextlibr   Útypingr   r   r   r   Z2sentence_transformers.evaluation.SentenceEvaluatorr   Z)sentence_transformers.SentenceTransformerr   Ú	getLoggerr>   r0   r	   r!   r!   r!   r"   Ú<module>   s   