LinkedIn est en train de remanier son architecture de recherche de publications, ce qui conduira à des résultats plus rapides et plus pertinents.
Une série d’améliorations apportées au système de recherche de publications de LinkedIn lui permettra de fournir des résultats plus rapides et plus pertinents dans une interface utilisateur simplifiée.
LinkedIn détaille le parcours de développement d’une nouvelle architecture système tout en expliquant la complexité de son ancien système.
Les résultats de recherche pour les publications étaient auparavant servis par deux index – un pour les posts dans le flux principal de LinkedIn et un autre pour les articles.
La nature complexe rendait difficile la construction, alors LinkedIn a décidé de découpler les deux indices. LinkedIn révèle l’ensemble du processus avec des détails dans un nouvel article de blog. Ici, il est résumé dans un diagramme :
Une grande partie des informations partagées par LinkedIn s’adresse aux ingénieurs logiciels. Dans cet article, on va sauter les détails techniques et expliquer ce que les changements signifient pour les utilisateurs réguliers sur LinkedIn.
LinkedIn Post Search fournit des résultats plus rapides et plus pertinents
Pour rendre les résultats de recherche plus pertinents, LinkedIn a entrepris de créer un système qui prend en compte les aspects suivants :
- Pertinence de la publication par rapport à une requête
- Qualité de la publication
- Personnalisation
- Intention de l’utilisateur
- Engagement
- Fraîcheur/récence
LinkedIn affirme que son nouveau système doit également fournir des résultats provenant de diverses sources.
LinkedIn tire parti de plusieurs techniques d’apprentissage automatique (machine learning) pour répondre aux attentes des chercheurs qui cherchent afin d’atteindre ces objectifs de pertinence et de diversité.
En outre, LinkedIn a collecté des évaluations humaines pour les résultats de recherche et a exploité les données pour s’assurer que son nouveau système répond à un certain seuil de qualité. LinkedIn note que les données d’annotation humaine participatives fournissent également des données d’entraînement précieuses pour améliorer le classement des résultats.
Nouveau système par rapport à l’ancien système
Le nouveau système de LinkedIn, alimenté par l’apprentissage automatique, améliore l’ancien système de la manière suivante :
- Pertinence : Le nouveau système de LinkedIn permet la personnalisation en tirant parti de signaux plus profonds et en temps réel pour l’intention, les centres d’intérêt et les affinités des membres.
- Diversité : Il augmente la découverte de contenu potentiellement viral pour les requêtes tendance et réduit la duplication de contenu similaire.
- Classement : Il utilise les métadonnées liées aux publications de l’index pour améliorer le classement des publications lorsqu’elles sont mélangées à d’autres types de résultats.
- Navigation : Il dispose d’une nouvelle interface utilisateur qui permet aux gens de rechercher des publications ou nouvelles d’un auteur spécifique, des publications qui correspondent à des requêtes citées, des publications récemment consultées, etc.
Les données montrent que le nouveau système est meilleur
LinkedIn affirme que les résultats de recherche fournis par son nouveau système ont augmenté la satisfaction des utilisateurs, ce qui se traduit par une augmentation de 20% des commentaires positifs.
Les résultats qui sont très pertinents pour la requête d’un utilisateur, que LinkedIn identifie comme des « résultats pertinents », ont conduit à une amélioration globale du taux de clics de plus de 10%.
Une plus grande diversité des publications provenant du réseau social du chercheur, de son emplacement géographique et de sa langue préférée a entraîné une augmentation de 20% de la messagerie au sein du réseau du chercheur.
Le temps nécessaire pour fournir des résultats de recherche a été réduit d’environ 62 ms pour Android, d’environ 34 ms pour iOS et d’environ 30 ms pour les navigateurs Web.
Améliorations futures
LinkedIn explique comment il continuera à améliorer les résultats de recherche pour les publications. Les futures mises à jour comprendront :
- Mise en œuvre du traitement du langage naturel pour comprendre la signification sémantique des requêtes.
- Faire apparaître des résultats plus récents pour les requêtes sur des sujets tendances, réduisant ainsi la boucle de rétroaction de quelques heures à quelques minutes.
- Étendre les capacités de compréhension des documents pour inclure la gestion du contenu multimédia tel que les images, les vidéos courtes et l’audio.
Source : Searchenginejournal