U Msz/RerankingEvaluator.__init__..rÚ_rz _results_@z.csvÚepochÚstepsZMAPzMRR@{}zNDCG@{}Úmap)ÚsuperÚ__init__ÚsamplesrÚloggerÚwarningrrrrrrÚ isinstanceÚdictÚlistÚvaluesÚcsv_fileÚformatÚcsv_headersrZprimary_metric)Úselfr)rrrrrrrrr©Ú __class__r r!r(,s4 ÿ$ ûzRerankingEvaluator.__init__éÿÿÿÿr)ÚmodelÚoutput_pathr$r%Úreturnc Csø|dkr0|dkrd|›}q4d|›d|›d}nd}|jdk rP|d|j›d 7}t d |j›d|›d¡| |¡}|d }|d}|d} dd„|jDƒ} dd„|jDƒ}t d t|jƒt | ¡t | ¡t | ¡t |¡t |¡t |¡¡¡t d |d¡¡t d |j|d¡¡t d |j| d¡¡|dk rº|j rºtj ||j¡}tj |¡} t|d| rtdnddd6}t |¡}| sœ| |j¡| ||||| g¡W5QRXd |d|j›|d|j›| i}| ||j¡}| ||¡|S)a Evaluates the model on the dataset and returns the evaluation metrics. Args: model (SentenceTransformer): The SentenceTransformer model to evaluate. output_path (str, optional): The output path to write the results. Defaults to None. epoch (int, optional): The current epoch number. Defaults to -1. steps (int, optional): The current step number. Defaults to -1. Returns: Dict[str, float]: A dictionary containing the evaluation metrics. r6z after epoch z in epoch z after z stepsrNz (truncated to ú)z0RerankingEvaluator: Evaluating the model on the z datasetú:r&ÚmrrÚndcgcSsg|]}t|dƒ‘qS)rrrr r r!r"}sz/RerankingEvaluator.__call__..cSsg|]}t|dƒ‘qS)rrrr r r!r"~szmQueries: {} Positives: Min {:.1f}, Mean {:.1f}, Max {:.1f} Negatives: Min {:.1f}, Mean {:.1f}, Max {:.1f}zMAP: {:.2f}édzMRR@{}: {:.2f}zNDCG@{}: {:.2f}ÚaÚwzutf-8)ÚnewlineÚmodeÚencodingzmrr@zndcg@)rr*ÚinforÚcompute_metricesr)r1rÚnpÚminÚmeanÚmaxrrÚosÚpathÚjoinr0ÚisfileÚopenÚcsvÚwriterÚwriterowr2Zprefix_name_to_metricsZ store_metrics_in_model_card_data)r3r7r8r$r%Zout_txtZscoresÚmean_apÚmean_mrrÚ mean_ndcgZ num_positivesZ num_negativesZcsv_pathZoutput_file_existsÚfrPZmetricsr r r!Ú__call__\s\ ùÿ ýzRerankingEvaluator.__call__cCs|jr| |¡S| |¡S)a Computes the evaluation metrics for the given model. Args: model (SentenceTransformer): The SentenceTransformer model to compute metrics for. Returns: Dict[str, float]: A dictionary containing the evaluation metrics. )rÚcompute_metrices_batchedÚcompute_metrices_individual)r3r7r r r!rE£sÿýz#RerankingEvaluator.compute_metricesc Csög}g}g}|jdkrtƒn | |j¡j|jdd„|jDƒd|j|jd}g}|jD] }| |d¡| |d¡qV|j|d|j|jd}W5QRXd\} } |jD]"}|| }| d 7} t|dƒ} t|dƒ}|| | | |…}| | |7} | d ks¦|d krq¦| ||¡}t|j ƒd kr,|d }t |¡}| ¡ ¡}d g| d g|}d }t|d |j…ƒD]&\}}||rnd |d }q–qn| |¡| t|g|g|jd¡| t||ƒ¡q¦t |¡}t |¡}t |¡}|||dœS) aE Computes the evaluation metrics in a batched way, by batching all queries and all documents together. Args: model (SentenceTransformer): The SentenceTransformer model to compute metrics for. Returns: Dict[str, float]: A dictionary containing the evaluation metrics. NcSsg|]}|d‘qS)Úqueryr rr r r!r"Ãsz?RerankingEvaluator.compute_metrices_batched..T©Zconvert_to_tensorrrrr)rrér©Úk©r&r<r=)rrÚtruncate_sentence_embeddingsÚencoder)rrÚextendrrÚshapeÚtorchÚargsortÚcpuÚtolistÚ enumeraterÚappendrrrFrH)r3r7Úall_mrr_scoresÚall_ndcg_scoresÚ all_ap_scoresZall_query_embsZall_docsrZ all_docs_embsZ query_idxZdocs_idxÚinstanceÚ query_embÚnum_posZnum_negÚdocs_embÚpred_scoresÚpred_scores_argsortÚis_relevantÚ mrr_scoreÚrankÚindexrRrSrTr r r!rW³s` ü ÿ z+RerankingEvaluator.compute_metrices_batchedc Cs°g}g}g}tj|j|jddD]`}|d}t|dƒ}t|dƒ}t|ƒdks"t|ƒdkrbq"||} dgt|ƒdgt|ƒ} |jdkr–tƒn | |j¡0|j|gd |j d d}|j| d |j d d}W5QRX| ||¡} t| jƒdkrú| d} t | ¡}| ¡ ¡} d}t|d|j…ƒD]&\}}| |r(d|d}qPq(| |¡| t| g| g|jd¡| t| | ƒ¡q"t |¡}t |¡}t |¡}|||d œS)aO Computes the evaluation metrics individually by embedding every (query, positive, negative) tuple individually. Args: model (SentenceTransformer): The SentenceTransformer model to compute metrics for. Returns: Dict[str, float]: A dictionary containing the evaluation metrics. ZSamples)ÚdisableÚdescrYrrrr[NTFrZr\r^)Útqdmr)rr.rrrr_r`rrrbrcrdrerfrgrrhrrrFrH)r3r7rirjrkrlrYrrZdocsrrrmrorprqrsrtrurRrSrTr r r!rXýsR ÿÿ z.RerankingEvaluator.compute_metrices_individual)Nr6r6)Ú__name__Ú __module__Ú__qualname__Ú__doc__r ÚintÚstrÚboolrrcZTensorrr(rÚfloatrVrErWrXÚ __classcell__r r r4r!rsDõõ1ÿ þGJr)rOÚloggingrJÚ contextlibrÚtypingrrrrZnumpyrFrcrxZsklearn.metricsrrZ2sentence_transformers.evaluation.SentenceEvaluatorr Zsentence_transformers.utilr Z)sentence_transformers.SentenceTransformerrÚ getLoggerryr*rr r r r!Ús