000 02649cam a2200301 4500500
005 20250118081213.0
041 _afre
042 _adc
100 1 0 _aCabanac, Guillaume
_eauthor
700 1 0 _a Hubert, Gilles
_eauthor
700 1 0 _a Boughanem, Mohand
_eauthor
700 1 0 _a Chrisment, Claude
_eauthor
245 0 0 _aImpact du « biais des ex aequo » dans les évaluations de recherche d'information
260 _c2011.
500 _a20
520 _aRésuméCet article considère la problématique de l’évaluation en recherche d’information, en particulier dans le cadre de Trec avec le programme trec_eval. Nous montrons que les systèmes de RI ne sont pas uniquement évalués en fonction de la pertinence des documents qu’ils restituent. En effet, dans le cas de documents ex aequo (trouvés avec le même score) leur nom est utilisé pour les départager. Nous assimilons cette façon de départager les ex aequo à un biais expérimental qui influence les scores attribués aux systèmes, et argumentons en faveur d’une stratégie pour les départager plus équitablement. L’étude de 22 éditions de Trec révèle une différence significative entre la stratégie conventionnelle et inéquitable de trec_eval et les stratégies équitables proposées. Ces résultats expérimentaux suggèrent l’intégration des stratégies proposées dans trec_eval afin d’encourager la réalisation d’expérimentations plus équitables.
520 _aWe consider Information Retrieval evaluation in the Trec framework with the trec_eval program. It appears that IR systems obtain scores regarding not only the relevance of retrieved documents, but also according to document names in case of ties, i.e., documents retrieved with a same score. We consider this tie-breaking strategy as an uncontrolled parameter influencing measure scores, and argue the case for fairer tie-breaking strategies. A study of 22 Trec editions reveals significant difference between the conventional unfair trec_eval strategy and the fairer strategies that we propose. This experimental result advocates integrating these fairer strategies into trec_eval for conducting fairer experiments.
690 _arecherche d'information
690 _aévaluation
690 _abiais expérimental
690 _aexpérimentation
690 _ameasurement
690 _auncontrolled parameter
690 _ainformation retrieval
690 _aexperiment
786 0 _nDocument numérique | 14 | 2 | 2011-09-01 | p. 149-168 | 1279-5127
856 4 1 _uhttps://shs.cairn.info/revue-document-numerique-2011-2-page-149?lang=fr&redirect-ssocas=7080
999 _c370071
_d370071