Accélérer la sortie de [DataStage]

 

Accélérer la

sortie de

[DataStage]

 

DataStage d’IBMc’est un peu le vieux moteur diesel : puissant, robuste, mais coûteux à entretenir, complexe à régler et pas vraiment conçu pour les architectures Cloud modernes.

Pour compléter le portrait, les jeunes informaticiens n’ont pas vraiment envie de s’y frotter.


L’avenir de cet ETL semble aujourd’hui s’inscrire en pointillé.

 

Face à cela, l’option la plus couramment mise en œuvre pour les migrations DataStage reste le « copier-coller » (Lift & Shift) vers telle ou telle cible.

 

Et là, trois problèmes majeurs apparaissent :

  1. Après 10, 15 ou 20 ans de développements, les flux DataStage ressemblent (peut-être 😊) à un énorme "plat de spaghettis" : dette technique, complexité accumulée… bon courage.
  2. Migrer en mode "T&M", c’est long, c’est cher… et en plus, c’est incertain.
  3. La technologie cible choisie, aussi moderne soit-elle aujourd’hui, finira tôt ou tard lestée de dette, de coûts de licence inflationnistes — en somme, presque un problème en devenir.

1 . Vue "Job Graph" dans DataStage

Comprendre le flux global du job - 

Cette vue permet de visualiser le pipeline complet d’un job DataStage sous forme graphique.

Chaque nœud représente une étape du traitement (source, transformation, jointure, agrégation, table cible) et les liens matérialisent les flux de données.

C’est la vue de compréhension globale du job DataStage et de sa logique d’exécution.

2. Vue "Job Lineage" dans DataStage

Tracer chaque champ, de la cible jusqu’aux sources - 

Cette vue présente la traçabilité descendante détaillée des données, champ par champ.

Elle permet de suivre l’origine d’un champ depuis la table cible jusqu’aux sources, transformation après transformation, en identifiant précisément les règles appliquées.

C’est la vue d’audit et d’explicabilité fine dans DataStage

3. Vue "Data Lineage multi techno"

Relier les technologies et comprendre les usages de l’information - 

Une vue macroscopique et transverse des flux de données, au-delà de DataStage. 

Elle relie les différents moteurs de transformation et usages métier au sein d’une interface unique, et met en évidence la consommation réelle de l’information.

C’est la vue holistique des flux et des usages de la donnée.

3' pour tout comprendre
 
 

Commentaires

Posts les plus consultés de ce blog

Power BI libère les utilisateurs… Mais comment garder la maîtrise de sa plateforme dans le temps ?

De la source à la cellule du dashboard : Cartographier le SI pour le reconstruire intelligemment

Migrer de SAP BO vers GCP Looker - Garder ses données en source ? Possible ?