Orange
BotiqueAI
📡 Orange🔬 Machine LearningClustering · Non supervisé · Réseaux 5G
Case Study

ML pour le Beamforming 5G

Utilisation de l'apprentissage automatique non supervisé pour regrouper les utilisateurs par comportement et profil de signal, afin que les faisceaux d'antenne servent plus de personnes, plus efficacement.

ML
Approche basée sur
Sans règles codées en dur
Non sup.
Apprentissage
Sans données labellisées
Clustering
Utilisateurs
Par comportement & profil signal
5G
Cible d'optimisation
Efficacité du beamforming
Le Défi

Servir plus d\'utilisateurs.
Avec la même antenne.

Les antennes 5G peuvent diriger des faisceaux radio avec une grande précision, mais décider quelle forme de faisceau utiliser, pour quel groupe d'utilisateurs, à quel moment, est un problème d'optimisation extrêmement complexe. Les approches traditionnelles reposent sur des configurations fixes qui laissent une capacité significative inexploitée.

Orange avait besoin d'une approche basée sur les données, scalable, capable d'apprendre automatiquement les patterns des utilisateurs, sans nécessiter de données labellisées ni d'ingénierie manuelle de règles.

Configurations de faisceau statiques
Le beamforming traditionnel utilise des patterns fixes qui ne s'adaptent pas à l'endroit où se trouvent réellement les utilisateurs.
L'optimisation par utilisateur ne passe pas à l'échelle
Calculer une configuration de faisceau individuelle pour chaque utilisateur en temps réel est prohibitif en calcul à l'échelle 5G.
Patterns d'utilisation hétérogènes
Les utilisateurs varient considérablement : en localisation, appareil, mobilité et demande de données. Aucune stratégie de faisceau unique ne fonctionne pour tous.
La Solution

Regrouper les utilisateurs,
optimiser les faisceaux.

Au lieu d'essayer d'optimiser un faisceau pour chaque utilisateur individuel en temps réel, nous avons appris à regrouper les utilisateurs en clusters comportementalement cohérents via du ML non supervisé. Chaque cluster obtient une configuration de faisceau optimisée, une approche bien plus scalable qui maintient un débit élevé sans coût de calcul exponentiel.

01
Ingénierie des features
Extraire les features de signal par utilisateur : RSRP, RSRQ, SINR, position spatiale, historique de débit, patterns de mobilité.
02
Clustering non supervisé
K-Means et DBSCAN regroupent les utilisateurs aux profils similaires, sans labels nécessaires. Chaque cluster représente un archétype d'usage distinct.
03
Optimisation du faisceau par cluster
Au lieu d'un faisceau par utilisateur, une configuration de faisceau optimisée par cluster. Réduction dramatique du calcul avec une perte de débit minimale.
04
Évaluation & itération
Score de silhouette, indice Davies-Bouldin et métriques de débit simulé valident la qualité des clusters. Les modèles se réentraînent quand les distributions d'utilisateurs évoluent.
K-Means
Algorithme principal
Groupement spatial & signal
DBSCAN
Détection anomalies
Supprime le bruit avant clustering
PCA
Dimensionnalité
Réduit l'espace de features d'abord
Zéro
Données labellisées
Pipeline entièrement non supervisé
Techniques ML

La boîte à outils non supervisée.

📍
K-Means: clustering spatial

Utilisateurs regroupés par position et profil de signal. K-Means trouve des regroupements naturels sans supervision, chaque centroïde représentant une cible de faisceau idéale.

Distance euclidienneMéthode du coude pour kBasé sur centroïdes
🌀
DBSCAN: filtrage du bruit

Identifie les utilisateurs aberrants qui ne s'intègrent dans aucun cluster (utilisateurs isolés ou en bordure de cellule) et les supprime avant le clustering principal.

Basé sur la densitéNombre de clusters non requisRobuste aux anomalies
📉
PCA: réduction dimensionnelle

Compresse l'espace de features de signal à haute dimension avant le clustering. Réduit le bruit, accélère l'entraînement et révèle les directions de variance dominantes.

Composantes principalesVariance expliquéeÉtape pré-clustering
📊
Métriques d'évaluation

Le score de silhouette mesure la séparation des clusters. L'indice Davies-Bouldin mesure la compacité. Le débit simulé valide l'impact réel.

Score de silhouetteDavies-BouldinSimulation de débit
Stack Technique

Du ML pur, sans boîtes noires.

🐍
Python
Langage principal pour le traitement des données, l'ingénierie de features et l'entraînement des modèles
🔢
Scikit-learn
K-Means, DBSCAN, PCA: la boîte à outils non supervisée complète
📐
NumPy / Pandas
Ingestion des données de signal, remodelage et préparation de la matrice de features
📊
Matplotlib / Seaborn
Visualisation des clusters et génération de graphiques d'évaluation
📡
Données de signal radio
RSRP, RSRQ, SINR, coordonnées spatiales et traces de mobilité par utilisateur
🔄
Réentraînement itératif
Les modèles se réentraînent à mesure que les patterns de densité d'utilisateurs et la topologie réseau évoluent
BotiqueAI
ML appliqué aux cas d'usage industriels
Nos Réalisations