Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Launchpad
Soyez les premiers à participer au prochain grand projet de jetons
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Commerce en gros : Comment un ingénieur logiciel trie des millions d'attributs de produits chaotiques
La plupart des débats sur la scalabilité du commerce électronique tournent autour de sujets sexuels : systèmes de recherche distribués, gestion en temps réel des stocks, algorithmes de recommandation. Mais derrière se cache un problème plus discret, mais plus tenace : la gestion des valeurs d’attributs. C’est un bruit technique présent dans chaque grande boutique en ligne.
Le problème silencieux : pourquoi les valeurs d’attributs compliquent tout
Les attributs produits sont fondamentaux pour l’expérience client. Ils alimentent filtres, comparaisons et classement dans la recherche. En théorie, c’est simple. En pratique : les valeurs brutes sont chaotiques.
Une simple valeur pourrait ressembler à : “XL”, “Small”, “12cm”, “Large”, “M”, “S”. Couleurs ? “RAL 3020”, “Crimson”, “Red”, “Dark Red”. Matériau ? “Steel”, “Carbon Steel”, “Stainless”, “Stainless Steel”.
Pris isolément, ces incohérences semblent inoffensives. Mais multipliez cela par 3 millions de SKUs, chacun avec une dizaine d’attributs – le problème devient systémique. Les filtres se comportent de manière imprévisible. Les moteurs de recherche perdent en pertinence. Les clients expérimentent des recherches plus lentes et frustrantes. Et en backend, les membres des équipes sont submergés par la correction manuelle des données.
Un ingénieur logiciel chez Zoro faisait face à ce défi : un problème facile à négliger, mais qui impactait chaque fiche produit.
La voie vers une automatisation intelligente sans perte de contrôle
Le premier principe était clair : pas de boîte noire d’IA. De tels systèmes sont difficiles à faire confiance, à déboguer ou à faire évoluer.
À la place, une pipeline hybride a été développée, qui :
Le résultat combine la pensée contextuelle des modèles linguistiques modernes avec des règles fixes et des contrôles. Une IA encadrée, pas hors de contrôle.
Vue d’ensemble de l’architecture : comment tout s’articule
Tout le traitement s’effectue dans des jobs en arrière-plan, en mode batch, pas en temps réel. Ce n’était pas un compromis – c’était une nécessité architecturale.
Les pipelines en temps réel peuvent sembler attrayants, mais conduisent à :
Le traitement batch permet plutôt :
L’architecture fonctionne ainsi :
Les quatre couches de la solution
Couche 1 : préparation des données
Avant d’appliquer l’intelligence, une étape de prétraitement claire. Suppression des espaces. Déduplication des valeurs. Contextualisation des breadcrumbs de catégorie en chaînes structurées. Suppression des entrées vides.
Cela peut sembler basique, mais cela améliore considérablement la performance de l’IA. Entrée de déchets, sortie de déchets – à cette échelle, de petites erreurs peuvent devenir de gros problèmes plus tard.
Couche 2 : tri intelligent avec contexte
Le modèle linguistique n’était pas simplement un outil de tri. Il réfléchissait aux valeurs.
Le service recevait :
Avec ce contexte, le modèle pouvait comprendre :
Le modèle renvoyait :
Couche 3 : fallback déterministe
Tous les attributs n’ont pas besoin d’intelligence. Les plages numériques, valeurs avec unités, et quantités simples profitent de :
La pipeline détectait automatiquement ces cas et utilisait une logique déterministe. Cela maintenait le système efficace et évitait des appels coûteux à des LLM.
Couche 4 : override humain
Chaque catégorie pouvait être taguée comme :
Ce système dual permettait aux humains de prendre la décision finale, tandis que l’intelligence prenait en charge la majorité du travail. Cela renforçait aussi la confiance – les marchands pouvaient toujours écraser le modèle.
De chaos à clarté : résultats pratiques
La pipeline a transformé des données brutes chaotiques :
Ces exemples illustrent comment la compréhension du contexte peut être combinée à des règles claires.
Persistance et contrôle sur toute la chaîne
Tous les résultats étaient stockés directement dans une MongoDB produits. MongoDB devenait la seule source pour :
Cela facilitait la vérification, la correction, la ré-exécution par catégorie, et la synchronisation avec d’autres systèmes.
Après tri, les valeurs alimentaient :
Cela garantissait que les filtres s’affichaient dans un ordre logique, que les fiches produits montraient des attributs cohérents, et que les moteurs de recherche classaient mieux les produits.
Pourquoi ne pas simplement faire en temps réel ?
Le traitement en temps réel aurait signifié :
Les jobs batch offraient plutôt :
Le compromis était un léger délai entre la collecte des données et leur affichage. L’avantage : une cohérence à grande échelle – ce que les clients apprécient bien plus.
Impact mesurable
La solution a permis :
Ce n’était pas qu’un gain technique – c’était aussi une victoire pour l’expérience utilisateur et les résultats business.
Leçons clés pour les ingénieurs logiciels en e-commerce
Conclusion
Trier des valeurs d’attributs paraît simple. Mais quand cela concerne des millions de produits, cela devient un vrai défi.
En combinant l’intelligence des modèles linguistiques avec des règles claires, du contexte et un contrôle humain, un problème complexe et caché a été transformé en un système propre et scalable.
Cela rappelle que certains des plus grands succès viennent de la résolution de problèmes ennuyeux – ceux qui sont faciles à négliger, mais qui apparaissent sur chaque fiche produit.