L’abstraction est le processus qui consiste à représenter des objets qui appartiennent au monde réel dans le monde du programme que l’on écrit. Il consiste essentiellement à extraire des variables pertinentes, attachées aux objets que l’on souhaite manipuler, et à les placer dans un modèle informatique convenable.
Supposons que l’on veuille écrire un programme qui gère des maisons.
Si l’on se place du point de vue de celui qui l’habite, on s’intéressera probablement au nombre de pièces, à leurs surfaces, si elle est proche des commerces, si elle est accessible par les transports en commun.
Celui qui la construit devra connaître les délais de construction, avoir le permis de construire et les plans, avoir des détails sur la façon de la connecter aux différents réseaux : égouts, eau, électricité, téléphone, etc…
Du point de vue de la municipalité qui a besoin de calculer ses impôts locaux, il faudra connaître la surface, la date de construction, l’implantation locale, etc…
Une même notion réelle peut donc donner différentes abstractions informatiques, toutes construites en fonction du problème posé. Toutes ces données doivent donc être regroupées ensemble dans une structure commune. La liste des données qui sera retenue variera avec l’application que l’on doit traiter.
On appelle cette phase d'analyse "l'analyse métier", et les abstractions qui en découlent le "domaine métier". Lorsque l'on écrit un logiciel qui fait des choses (ce n'est pas toujours le cas...), on définit toujours le "domaine métier", et les objets de ce domaine.
La construction d'un modèle objet suit des règles. Certaines sont des règles systématiques, d'autres sont plus empiriques. Le fait de disposer d'un injecteur de dépendances, de s'imposer une bonne testabilité du code que l'on écrit, que ce soit unitairement ou à plus haut niveau a un impact sur la façon dont on construit ces classes métier ou techniques. Nous verrons ces règles dans la suite de ce document.
La première étape du travail de conception a consisté à définir les données intéressantes, et à les regrouper dans des structures qui ont un sens. La deuxième étape consiste à définir les méthodes d’accès à ces données, et les calculs qui seront effectués dessus. L’idée de la programmation objet est de regrouper ces méthodes d’accès et de calcul dans la même structure que les données.
Le regroupement des données et des méthodes est un des points importants des langages objet, qui n’est absolument pas supporté dans des langages tels que le C, Pascal ou Fortran. C’est cela que l’on appelle l’encapsulation.
Les opérations sur les types définis à l’avance sont en général des opérations arithmétiques tels que +, -, * et /. En Java, les opérations sur les types de données définis par l’utilisateur sont des méthodes.
Il n’est pas possible de redéfinir les opérateurs de base pour les faire agir sur des types de données autres que ceux pour lesquels ils sont prévus, à la différence du C++. La communauté Java réfléchit activement à cet aspect, et il est possible que cette fonctionnalité apparaisse à l’avenir. Ce genre de chose doit être utilisé avec beaucoup de précautions, dans la mesure où il devient difficile, une fois qu’un code a été écrit, de savoir quel type d’opération est réellement effectué à quel moment.
La seule exception à cette règle est la possibilité d'utiliser l'opérateur + pour concaténer les chaînes de caractères.