La programmation orientée objet est une méthode de programmation informatique de plus en plus plébiscitée, que ce soit dans le développement logiciel ou la data science. Organisée autour des objets, ou données, la programmation orientée objet offre de nombreux avantages.
La programmation orientée objet (POO) est un paradigme informatique consistant à définir et à faire interagir des objets grâce à différentes technologies, notamment les langages de programmation (Python, Java, C++, Ruby, Visual Basic.NET, Simula…). On appelle objet, un ensemble de variables complexes et de fonctions, comme par exemple un bouton ou une fenêtre sur l’ordinateur, des personnes (avec les noms, adresse…), une musique, une voiture… Presque tout peut être considéré comme un objet.
L’objectif de la programmation orientée objet est de se concentrer sur l’objet lui-même et les données, plutôt que sur la logique nécessaire et les actions à mener pour faire cette manipulation.
La programmation orientée objet se déroule en plusieurs étapes. La première consiste à modéliser les données en identifiant les objets que le programmeur souhaite manipuler ainsi que leurs interactions. Une fois que les objets ont été modélisés, ils sont ensuite conceptualisés dans une classe d’objets, qui aura des attributs et des méthodes. Les attributs correspondent aux caractéristiques de l’objet et les méthodes aux actions que peut faire cet objet. Une fois l’objet créé, il communique avec une interface bien définie appelée message.
En masquant les fonctions et variables de l’objet, le programmeur crée un code source parfois complexe mais facilement utilisable, tout en renforçant la sécurité du système et en évitant la corruption accidentelle de données. Grâce à ses propriétés d’héritage et de polymorphisme, une classe est réutilisable par le programme pour lequel elle a été créée, mais aussi par d’autres programmes orientés objet.
Les data scientist et autres professionnels en data science utilisent beaucoup le langage Python, qui donne accès à de nombreuses librairies. Ces librairies contiennent des modules contenant eux-mêmes des classes. C’est le principe de l’encapsulation. En important ces librairies, le data scientist n’a pas besoin de connaître le code développé dans les classes de la librairie mais il doit comprendre les méthodes et leur logique de fonctionnement pour obtenir ce dont il a besoin.
Avec Futura