Nous allons dans un premier temps en donner un "aperçu" de la théorie, en cherchant les propriétés que l'on aimerait bien trouver pour les ensembles. Ensuite on listera les axiomes de la théories avant de montrer comment ils permettent d'obtenir ce que l'on souhaite.
Puisque nous allons travailler dans "le regroupement de tous les ensembles" (appelé Univers), tous les objets mathématiques que l'on construira par la suite seront de ce fait des ensembles. Une première remarque est que lorsque l'on parle d'un ensemble, on dit "ce qui le constitue" : une droite est ainsi un ensemble de points. Il serait donc pratique de définir un ensemble par ses éléments : on se servira de l'axiome d'extensionnalité.
Pour dire qu'un ensemble est élément d'un autre, il faudra alors mettre en place une relation d'appartenance noté . Ainsi si est élément de (dit aussi appartient à ou contient ), on écrit alors . Le contraire, n'appartient pas à sera noté . Notons que le terme "élément" sert juste à dire que appartient à , et ne sert en aucun cas à montrer une différence de nature entre et , puisqu'ils sont tous les deux des ensembles.
Si on réfléchit aux ensembles qui pourraient être intéressants, deux retiennent notre attention : l'un qui contiendrait tous les ensembles et l'autre pour lequel aucun ensemble n'est élément. L'existence du premier entraîne des contradictions, c'est pourquoi on préfère utiliser à la place de "l'ensemble de tous les ensembles" la notion d'Univers citée plus haut. Par contre le deuxième est effectivement un ensemble que l'on appelle l'ensemble vide noté .
On aimerait ensuite définir un ensemble en regroupant plusieurs ensembles. On commence par un ensemble contenant un unique élément (on parle de singleton), que l'on notera , et on continue de même pour définir un ensemble dont les seuls éléments sont et . Pour se faire, on utilisera l'axiome de la paire qui permet de définir un ensemble à deux éléments (ou de un si les ensembles en question sont égaux). Il permettra aussi, moyennant un autre axiome, de définir des ensembles finis. Par contre, pour introduire l'infini, on devra utiliser l'axiome de l'infini.

Commençons par une petite illustration de la notion de sous-ensemble, en prenant comme ensemble de référence une bibliothèque, dont les éléments sont les livres. Une étagère comportant un certain nombre de livres peut être considérée comme un ensemble de livres. De même, un rayon de cette étagère sera un autre ensemble de livres. Comme tous les livres de ce rayon appartiennent à l'étagère on dira que le rayon est un sous-ensemble de l'étagère. De la même façon, le rayon et l'étagère sont deux sous-ensembles de la bibliothèques.
Il faut cependant faire attention à cette représentation imagée, car on pourrait croire que les pages d'un livre pris dans la bibliothèque soient un sous-ensemble de celle-ci, puisque les pages sont contenues dans le livre, lui-même contenu dans la bibliothèque. Mais cela est faux, car les pages sont des "éléments d'un élément de la bibliothèque" et non des "éléments de la bibliothèque". La confusion vient du verbe contenir, qui peut à la fois signifier "a pour élément" ou "a pour sous-ensemble". Il faut aussi prendre garde à bien définir l'ensemble par ses éléments (comme on l'a dit plus haut) : ici la bibliothèque est considérée comme un ensemble de livres, on ne tient compte ni du bâtiment, ni du mobilier.
Pour deux ensembles et , on dit que est un sous-ensemble ou une partie de , si tous les éléments de sont éléments de . On dit encore que est inclus dans ou que contient . Ainsi, on utilise les écritures « pour signifier « ». On comprend aisément que lorsque l'on a un ensemble , on voudrait bien pouvoir construire un sous-ensemble de en "choisissant" des éléments de . Cela se fera par le schéma d'axiome de séparation, en prenant les éléments de qui répondent à une certaine propriété.
Il est alors naturel de considérer l'ensemble formé en regroupant tous ces sous-ensembles, appelé l'ensemble des parties de et noté . Il sera défini par un axiome supplémentaire : l'axiome des parties. on a alors l'équivalence : .
Illustrons la notion d'ensemble des parties : soit un ensemble, alors . On peut remarquer que pour tout ensemble , l'ensemble vide et lui-même sont inclus dans , c'est-à-dire sont éléments de .

Le schéma ci-dessus donne une représentation imagée d'ensembles. A gauche, on voit qu'avec deux ensembles et , on peut prendre les éléments qu'ils ont en communs, c'est l'intersection (lire « A inter B »). On peut à l'inverse prendre les éléments qu'ils n'ont pas en communs, ce sont les différences ensemblistes et (lire « A privé de B » et « B privé de A »). Ces deux ensembles rouge et bleu regroupés forment ce qu'on appelle usuellement la différence symétrique notée .
Au centre, on a regroupé les éléments de et pour former la réunion et noté (lire « A union B »). Enfin, à droite, en se plaçant dans un ensemble de référence , on peut prendre tous les éléments qui n'appartiennent pas à : c'est le complémentaire de noté .
Les notions d'intersection, de différence ensembliste, de différence symétrique et de complémentaire ne sont autres que des sous-ensembles que l'on pourra définir par l'axiome de séparation. Par contre pour la réunion de deux ensembles, on devra utiliser l'axiome de l'union. Cette axiome pourra de plus s'appliquer à une infinité d'ensemble, à condition qu'on les aie auparavant "regroupés" dans un même ensemble.
Une autre opération moins évidente, mais offrant de nombreuses autres possibilités, est celle fournie par le le schéma d'axiomes de remplacement. Décrivons-le rapidement. Prenons une formule disposant d'au moins paramètres, et supposons en outre la propriété suivante : le choix d'un ensemble comme premier paramètre, implique qu'il existe au plus un ensemble qui substitué au second paramètre, rende la formule vraie. Autrement dit, cette formule fournit un procédé qui associe à chaque ensemble, soit aucun soit un seul autre ensemble. L'axiome de remplacement dit alors que l'on a le droit de regrouper tous les ensembles associés aux éléments d'un ensemble donné, pour obtenir un nouvel ensemble.
A titre d'exemple, montrons que les axiomes de remplaçement permettent d'obtenir les axiomes de la paire et de séparation. On remarque que est un ensemble à deux éléments. Ainsi on peut "remplacer" et par deux ensembles et quelconques pour obtenir l'ensemble . De même, à partir d'un ensemble donné, on peut construire le sous-ensemble des éléments qui répondent à une certaine propriété : il suffit d'appliquer l'axiome de remplacement en disant que les éléments répondant à la propriété ont pour unique image eux-même, tandis que les autres n'en ont pas.
Jusqu'ici, on a pas encore parlé des "constituants" des ensembles, mais on a juste vu des relations d'appartenance et d'inclusion entre eux. On a aussi dit que les éléments d'un ensemble étaient eux-même des ensembles, et qu'il y a donc des éléments d'éléments et ainsi de suite. Pourtant si on considère un ensemble de nombre on ne voit pas trop ce que pourrait être "les éléments des éléments". Or on a aussi dit que les objets mathématiques pouvaient être construit grâce à des ensembles, il convient donc de se restreindre notre théorie au seul type d'objets construit seulement à partir de l'ensemble vide .
Ainsi, les ensembles , ,, sont des "ensembles purs".
Pour opérer une telle restriction, on utilise l'axiome de fondation. Cela interdit alors l'existence de suite infinie décroissante d'ensemble pour la relation d'appartenance, par exemple celle entrainée par l'expression .
Voici les axiomes du systèmes ZF. On ajoute parfois des axiomes d'introduction pour définir l'ensemble vide, ou encore les notations spécifiques pour l'ensemble des parties, l'union, l'inclusion... Notons aussi que, comme on l'a vu plus haut, l'axiome de la paire et le schéma d'axiomes de séparation sont conséquences des autres axiomes, et que l'on peut les retirer sans affaiblir la théorie.
Deux ensembles sont égaux si ils ont les mêmes éléments.
Pour deux ensembles donnés il existe un ensemble E qui a pour seuls éléments ces deux ensembles.
Pour tout ensemble I il existe un ensemble E dont les éléments sont exactement ceux des éléments de I.
Pour tout ensemble E il existe un ensemble dont les éléments sont les sous-ensembles de E.
Tout sous-ensemble de E existe s'il est définissable par une formule.
Si
alors
Si une formule φ "associe" à tout ensemble un unique ensemble, alors pour tout ensemble A il existe un ensemble B dont les éléments sont les ensembles associés aux éléments (pour lesquels l'association est possible) de A par cette formule.
Il existe un ensemble infini (plus précisément un ensemble inductif).
Tout ensemble E non vide possède un élément qui ne contient aucun autre élément de E.
Si deux ensembles et sont égaux, alors tous leurs éléments sont égaux car d'après la règle de substitution, . L'axiome d'extensionnalité nous permet de plus d'affirmer que si tous les éléments de appartiennent à et réciproquement, alors ces ensembles sont égaux. Si on utilise les symboles d'inclusion, on peut ainsi ecrire l'équivalence : . Cet axiome nous assure aussi l'unicité des ensembles créés, on peut donc leurs attribuer une notation propre.
Par exemple, pour un ensemble donné, l'axiome des parties assure l'existence de l'ensemble des parties de E, noté . De même l'image d'un ensemble par une "fonction" définie sur l'univers peut s'écrire . La paire formée des ensembles et est quant à elle notée . En utilisant l'axiome de la paire sur deux ensembles égaux, alors l'ensemble formé n'a alors en fait qu'un seul élément, on parle de singleton. Ainsi, est l'ensemble dont le seul élément est . L'axiome de l'union appliqué à un ensemble donne lui aussi un seul élément que l'on écrit , et si , la réunion se noté évidemment . Si on a un troisième ensemble , utilise encore les accolades pour noter l'ensemble dont les éléments sont , qui est construit ainsi : . On peut évidemment continuer de cette façon pour un nombre fini d'ensemble.
Soit un ensemble et une "fonction" tels que tout élément aie une image par . Alors on note aussi l'ensemble . On applique l'axiome de séparation sur cet ensemble de manière à obtenir tous les éléments communs à tout les , que l'on note naturellement .
Le schéma d'axiomes de séparation permet de construire une partie d'un ensemble, que l'on note habituellement de cette façon : . L'axiome d'extensionnalité assure une nouvelle fois l'unicité de tels ensembles.
C'est ainsi que l'intersection de et est notée , c'est l'ensemble des éléments communs de deux ensembles et : . La différence ensembliste privé de noté est définie par . En particulier, on définit l'ensemble vide par , en prenant l'ensemble donné par l'axiome de l'infini. Lorsque cette différence s'effectue sur un ensemble de référence , alors privé de est appelé le complémentaire de noté ou . Enfin, la différence symétrique de et est alors définie par .
Ces deux axiomes méritent d'être étudiés plus en détail, car leurs intérêts ne sont pas visibles au premier abord. L'axiome de l'infini a un rôle essentiel dans la construction des nombres ordinaux, c'est pourquoi nous n'allons pas en parler maintenant, mais évidemment il permet d'introduire comme son nom l'indique, l'infini dans la théorie.
Quant à l'axiome de fondation, il permet tout d'abord d'éviter qu'un ensemble soit élément de lui-même. En effet, si , alors l'ensemble contredit l'axiome.
Plus généralement, on ne peut avoir de suite d'ensembles "infinie décroissante" c'est-à-dire telle que pour tout entier naturel n, on a . En effet en considèrant l'image de la suite , définie par l'axiome de remplacement, on voit que contredit encore l'axiome. Plus particulièrement, des cycles ne peuvent exister (on retrouverait le cas de la suite citée plus haut, où l'on reviendrait cependant au terme initial à partir d'un certain rang) et donc le cas non plus.
Enfin, mais nous ne rentrerons pas dans les détails, l'axiome de fondation assure que les ensembles peuvent tous être construits en partant de l'ensemble vide.
La théorie qui vient de vous être présentée est celle de Zermelo-Frankel, dite aussi théorie classiques des ensembles ou plus simplement ZF. Souvent on ajoute de nouveaux axiomes, comme les axiomes des grands cardinaux, l'hypothèse du continu, l'axiome du choix... nous aurons par ailleurs besoin de ce dernier axiome, dont nous allons parler dans le chapitre suivant.