📡 Orange🔬 Machine LearningClustering · Non supervisé · Réseaux 5G

Case Study

ML pour le Beamforming 5G

Utilisation de l'apprentissage automatique non supervisé pour regrouper les utilisateurs par comportement et profil de signal, afin que les faisceaux d'antenne servent plus de personnes, plus efficacement.

Approche basée sur

Sans règles codées en dur

Non sup.

Apprentissage

Sans données labellisées

Clustering

Utilisateurs

Par comportement & profil signal

Cible d'optimisation

Efficacité du beamforming

Le Défi

Servir plus d\'utilisateurs.
Avec la même antenne.

Les antennes 5G peuvent diriger des faisceaux radio avec une grande précision, mais décider quelle forme de faisceau utiliser, pour quel groupe d'utilisateurs, à quel moment, est un problème d'optimisation extrêmement complexe. Les approches traditionnelles reposent sur des configurations fixes qui laissent une capacité significative inexploitée.

Orange avait besoin d'une approche basée sur les données, scalable, capable d'apprendre automatiquement les patterns des utilisateurs, sans nécessiter de données labellisées ni d'ingénierie manuelle de règles.

Configurations de faisceau statiques

Le beamforming traditionnel utilise des patterns fixes qui ne s'adaptent pas à l'endroit où se trouvent réellement les utilisateurs.

L'optimisation par utilisateur ne passe pas à l'échelle

Calculer une configuration de faisceau individuelle pour chaque utilisateur en temps réel est prohibitif en calcul à l'échelle 5G.

Patterns d'utilisation hétérogènes

Les utilisateurs varient considérablement : en localisation, appareil, mobilité et demande de données. Aucune stratégie de faisceau unique ne fonctionne pour tous.

La Solution

Regrouper les utilisateurs,
optimiser les faisceaux.

Au lieu d'essayer d'optimiser un faisceau pour chaque utilisateur individuel en temps réel, nous avons appris à regrouper les utilisateurs en clusters comportementalement cohérents via du ML non supervisé. Chaque cluster obtient une configuration de faisceau optimisée, une approche bien plus scalable qui maintient un débit élevé sans coût de calcul exponentiel.

Ingénierie des features

Extraire les features de signal par utilisateur : RSRP, RSRQ, SINR, position spatiale, historique de débit, patterns de mobilité.

Clustering non supervisé

K-Means et DBSCAN regroupent les utilisateurs aux profils similaires, sans labels nécessaires. Chaque cluster représente un archétype d'usage distinct.

Optimisation du faisceau par cluster

Au lieu d'un faisceau par utilisateur, une configuration de faisceau optimisée par cluster. Réduction dramatique du calcul avec une perte de débit minimale.

Évaluation & itération

Score de silhouette, indice Davies-Bouldin et métriques de débit simulé valident la qualité des clusters. Les modèles se réentraînent quand les distributions d'utilisateurs évoluent.

K-Means

Algorithme principal

Groupement spatial & signal

DBSCAN

Détection anomalies

Supprime le bruit avant clustering

PCA

Dimensionnalité

Réduit l'espace de features d'abord

Zéro

Données labellisées

Pipeline entièrement non supervisé

Techniques ML

La boîte à outils non supervisée.

📍

K-Means: clustering spatial

Utilisateurs regroupés par position et profil de signal. K-Means trouve des regroupements naturels sans supervision, chaque centroïde représentant une cible de faisceau idéale.

Distance euclidienneMéthode du coude pour kBasé sur centroïdes

🌀

DBSCAN: filtrage du bruit

Identifie les utilisateurs aberrants qui ne s'intègrent dans aucun cluster (utilisateurs isolés ou en bordure de cellule) et les supprime avant le clustering principal.

Basé sur la densitéNombre de clusters non requisRobuste aux anomalies

📉

PCA: réduction dimensionnelle

Compresse l'espace de features de signal à haute dimension avant le clustering. Réduit le bruit, accélère l'entraînement et révèle les directions de variance dominantes.

Composantes principalesVariance expliquéeÉtape pré-clustering

📊

Métriques d'évaluation

Le score de silhouette mesure la séparation des clusters. L'indice Davies-Bouldin mesure la compacité. Le débit simulé valide l'impact réel.

Score de silhouetteDavies-BouldinSimulation de débit

Stack Technique

Du ML pur, sans boîtes noires.

🐍

Python

Langage principal pour le traitement des données, l'ingénierie de features et l'entraînement des modèles

🔢

Scikit-learn

K-Means, DBSCAN, PCA: la boîte à outils non supervisée complète

📐

NumPy / Pandas

Ingestion des données de signal, remodelage et préparation de la matrice de features

📊

Matplotlib / Seaborn

Visualisation des clusters et génération de graphiques d'évaluation

📡

Données de signal radio

RSRP, RSRQ, SINR, coordonnées spatiales et traces de mobilité par utilisateur

🔄

Réentraînement itératif

Les modèles se réentraînent à mesure que les patterns de densité d'utilisateurs et la topologie réseau évoluent

BotiqueAI

ML appliqué aux cas d'usage industriels

← Nos Réalisations

Servir plus d\'utilisateurs.Avec la même antenne.

Regrouper les utilisateurs,optimiser les faisceaux.

La boîte à outils non supervisée.

Du ML pur, sans boîtes noires.

Servir plus d\'utilisateurs.
Avec la même antenne.

Regrouper les utilisateurs,
optimiser les faisceaux.