La recommandation joue un rôle central dans le e-commerce et dans l'industrie du divertissement. L'intérêt croissant pour la transparence algorithmique nous motive dans cet article à observer les résultats de recommandations sous la forme d'un graphe capturant les navigations proposées dans l'espace des items. Nous argumentons qu'une telle approche en "boite noire" est utile dans le cas d'une exploration limitée à un utilisateur: nous illustrons une topologie tirée de recommandations à un utilisateur de Youtube, fournissons ses caractéristiques clés, et montrons qu'elle renseigne sur la connaissance de cet utilisateur par le système. Nous montrons ensuite que l'analyse de cette topologie d'aborder la question du \text{biais} potentiel dans ces recommandations. Nous postulons que les systèmes de recommandation produisent naturellement des topologies cohérentes, et qu'une manipulation de ces résultats par l'ajout de liens biaisés a toutes les chances de violer cette cohérence (à la manières des liens longs d'un modèle "petit monde"). Ce postulat est supporté par l'analyse d'un modèle génératif basé sur les kNN et par l'exploitation du crawl Youtube, en ciblant la prédiction de liens "Recommandé pour vous" (i.e., biaisés ou non par Youtube).
La face topologique des recommandations
La face topologique des recommandations
La face topologique des recommandations
Related Content
To work at scale, a complete image indexing system comprises two components: An inverted file index to restrict the actual search to only a subset that should contain most of the items relevant to the query; An approximate distance computation mechanism to rapidly scan these lists. While supervised deep learning has recently enabled improvements to the latter, t…
This article presents an empirical study that investigated and compared two “big data” text analysis methods: dictionary-based analysis, perhaps the most popular automated analysis approach in social science research, and unsupervised topic modeling (i.e., Latent Dirichlet Allocation [LDA] analysis), one of the most widely used algorithms in the field of compute…
The ability of multimedia data to attract and keep people’s interest for longer periods of time is gaining more and more importance in the fields of information retrieval and recommendation, especially in the context of the ever growing market value of social media and advertising. In this chapter we introduce a benchmarking framework (dataset and evaluation too…
Webinar /Jun 2024
Blog Post /Jun 2025
Blog Post /Jun 2025