Sommaire général de l'ouvrage 1.4. Variables et ensembles Le langage mathématique est fait de symboles. Commençons par les plus simples cas.
Constantes
Un symbole de constante est un symbole désignant un objet mathématique bien précis, appelé sa valeur.
Par exemple le chiffre 3, les symboles "∅", "ℕ" sont des symboles de constante qui désignent respectivement le nombre 3, l'ensemble vide et l'ensemble des entiers naturels. Aussi, "vrai" et "faux" sont des constantes désignant les deux valeurs de vérités qui seront les deux valeurs possibles des énoncés. Ils tiendront donc eux-mêmes lieu d'énoncés.
Le langage courant comporte aussi de nombreux symboles de constantes: tout nom propre et tout nom précédé d'un article défini ("le", "la") (sans complément, sinon ce serait une formule) est ce qui en langage courant joue le rôle de symboles de constantes.
Variables libres ou liées
Un symbole de variable est un symbole pouvant être interprété de plusieurs manières:
chaque interprétation (point de vue) attribue à ce symbole une valeur particulière. Autrement
dit, sa valeur (l'objet mathématique qu'il désigne) dépend de l'interprétation adoptée.
Ainsi, cette notion est marquée par une multiplicité de points de vue :
les points de vue "de l'intérieur" dans lesquels cette variable est interprétée comme une constante prenant une valeur particulière parmi les possibilités, et le point de vue "de l'extérieur"
sous l'angle duquel on est conscient de la multiplicité des interprétations possibles.
On a bien besoin d'un tel outil afin d'avoir une chance de pouvoir désigner par nos symboles
n'importe quel objet du monde mathématique qui est plus vaste que le langage dont
nous disposons pour l'étudier: ainsi pourra-t-on évoquer beaucoup d'objets comme valeurs possibles d'une même variable.
On appelle fixer une variable le fait de se plonger (provisoirement) dans une interprétation particulière possible de cette variable et la voir ainsi comme constante. Chaque valeur possible d'une variable constitue donc
une manière possible de la fixer.
Une formule faisant intervenir une variable est à interpréter du point de vue où la variable est fixée, jusqu'à mention explicite du passage au point de vue global.
On dit qu'une variable est libre tant qu'on l'utilise ainsi comme étant fixée (interprétée par une valeur particulière), et qu'on peut donc réemployer ce symbole pour désigner la même valeur, comme s'il s'agissait d'une constante.
Mais quand on cesse de le faire pour regarder le bilan de toutes les interprétations, cette variable est alors dite liée. Nous verrons plus loin comment cela se pratique.
Remplacer toutes les occurences d'un symbole de variable liée par un autre même symbole qui ne figure pas déjà dans le même contexte, ne change pas la signification du tout; contrairement au cas d'un symbole de variable libre. (Autrement dit, ce que je dis à l'aide du symbole x, je peux le dire aussi à l'aide du symbole y pour signifier la même chose, du moment qu'aucun contexte extérieur ne vient fixer les valeurs de x ni de y).
Par plus ou moins un abus de langage, on se permettra de réemployer une même lettre pour désigner plusieurs variables liées dans des contextes séparés, autrement dit n'ayant pas lieu d'être interprétées simultanément d'un même point de vue (et pouvant donc prendre des valeurs différentes entre les angles d'interprétation de l'une et de l'autre). Remarquons qu'en langage courant on fait sans cesse cet abus, n'ayant qu'un nombre fort réduit de symboles de variables à disposition ("lui", "elle", "eux", et quelques autres), au risque de toutes les confusions.
Une constante est essentiellement une variable ayant une unique valeur possible.
Termes
On appellera terme une structure de langage servant à désigner un objet. Les plus simples termes sont les symboles de constante ou de variable. On verra les autres plus tard.
Usage des variables, égalité, équivalence
On peut employer le symbole d'égalité entre des termes (par exemple "x=y"),
pour former l'énoncé signifiant qu'ils ont la même valeur.
En fait, le langage employé à un endroit donné ne figurant pas lui-même parmi ses propres objets comme nous expliquerons plus loin, l'interprétation d'un symbole qui y est employé comme celui d'égalité n'a pas à se soucier de la manière dont les autres parties de la même formule forment leur signification, mais uniquement de leur valeur. On parle donc directement par exemple
de la notion d'égalité entre des objets désignés par ailleurs (ces objets étant les valeurs des termes), pour signifier l'affirmation que c'est le même objet.
On peut définir et étudier toute opération entre objets, à l'aide de symboles de variables recevant ces valeurs, symboles qui, ultérieurement, pourront être remplacés par tous les termes qu'on voudra, pour appliquer ces opérations aux valeurs de ces termes.
Si deux objets sont égaux, tout ce qui est vrai de l'un est vrai de l'autre.
L'égalité entre valeurs de vérité se nomme également équivalence, et se note ⇔ .
Domaines et ensembles
On appelle domaine d'une variable, la pure signification de cette variable
comme variable liée, à savoir la connaissance de ses multiples valeurs possibles ("connaissance", non d'un
point de vue humain, mais métaphoriquement du point de vue du monde mathématique),
abstraction faite de tout le contexte de ce qui peut être lié au choix d'une de ces valeurs.
Ainsi, quand on parle du domaine d'une variable, on la voit liée.
Le domaine d'une variable est un objet mathématique appelé un ensemble.
Tout cela étant relatif au point de vue, on peut aussi bien, étant donnée une variable x,
d'abord la fixer, puis, voyant donc x comme une constante, qui est un cas particulier de variable, regarder ce qu'est
alors le domaine de x: ce domaine est appelé un singleton, noté {x}. Bien sûr, il dépend de la valeur de x, donc est variable, et a lui-même un domaine lorsque x varie.
Il reste à inclure le cas très spécial de l'ensemble vide ∅, qu'on pourrait à la limite
comprendre comme domaine d'une "variable" impossible, pour laquelle il ne se trouverait aucune valeur
qui puisse lui être attribuée.
Inversement, étant donné un ensemble E, on peut introduire une nouvelle
variable qui, indépendamment des valeurs des autres
variables présentes dans le contexte (libres), aura pour domaine E. On dit qu'une telle
variable parcourtE.
En pratique, dans le langage courant, un nom commun désigne un ensemble,
et l'article indéfini ("un", "une") devant lui, introduit une variable de
domaine cet ensemble, à moins qu'il ne serve dans le rôle de relation d'appartenance:
Appartenance
(Note: on écrira "ssi" comme abbréviation de "si et seulement si", qui signifie que les énoncés écrits avant et après sont équivalents; ceci servant souvent à définir le premier à l'aide du deuxième.)
Etant donnés un objet x et un ensemble E, on dit que xappartient
à E ou E contient x et on note x ∈ E ssi x est une valeur possible d'une variable
de domaine E. Ce qui, dans le cas du langage courant où l'ensemble est désigné
par un nom commun, apparaît très simplement: "c'est un...".
L'énoncé x ∈ ∅ est toujours faux, et l'énoncé y ∈ {x} équivaut à y=x.
Négation
La négation d'un énoncé (affirmation de sa fausseté, donnant la valeur de vérité contraire de celle de cet énoncé) s'exprime généralement en écrivant "non" suivi de l'énoncé (entre parenthèse si besoin): non(vrai)=faux, non(faux)=vrai.
Si l'énoncé à nier est construit sur un symbole simple comme le symbole d'égalité, on pourra abbréger la négation en barrant ce symbole. Ainsi, x ≠ y est l'abbréviation de non(x=y) et se lit "x est différent de y"; de même, x ∉ E signifie non(x ∈ E) et se lit "x n'appartient pas à E".
Ainsi, pour tout énoncé P on a (non(nonP)) ⇔ P), et (P ⇎ (nonP)).
Quantificateurs
Nous avons présenté un ensemble E comme la "connaissance" de toutes les valeurs qu'on envisage comme interprétations pour une variable donnée "x" de domaine E. Alors, étant donné un énoncé P(x) (un énoncé où peut entre autres figurer x) vrai ou faux pour chaque interprétation particulière (une question clairement définie en oui ou non), passant au point de vue global on peut parler de son bilan sur cet ensemble et formuler ainsi d'autres énoncés (vrais ou faux) du point de vue où x est liée. En particulier:
- dire s'il existe une valeur de x pour laquelle P donne la valeur vrai, ce qu'on note "∃x ∈ E, P(x)" et on lit "il existe x dans E tel que P(x)". Ce symbole ∃ est appelé le quantificateur existentiel.
- dire si P donne toujours la valeur vrai, ce qu'on note "∀x ∈ E, P(x)" ("quel que soit x dans E,..."). C'est le quantificateur universel.
Ce sont comme deux présentations d'une même opération au travers l'échange des valeurs vrai et faux: dire qu'un énoncé est toujours vrai équivaut à nier l'existence d'un contre-exemple, autrement dit, dire qu'il existe une valeur de x pour laquelle un énoncé est vrai, équivaut à nier qu'il soit toujours faux:
∃x ∈ E, P(x) ⇔
non
(∀x ∈ E,
non
P(x))
non
(∃x ∈ E, P(x)) ⇔ ∀x ∈ E,
non
P(x)
non
(∃x ∈ E,
non
P(x)) ⇔ ∀x ∈ E, P(x)
∃x ∈ E,
non
P(x) ⇔
non
(∀x ∈ E, P(x)).
Dans les notations des quantificateurs, le fait d'employer apparemment, entre la variable et son domaine, le même symbole ∈ que le symbole d'appartenance précédemment introduit, est une sorte d'abus de notation habituel: rigoureusement il faut comprendre cela comme étant deux notations différentes (toute confusion d'usage étant évitée par le contexte syntaxique de la formule).
La notion d'appartenance permet d'interpréter ∀x ∈ E, P(x) comme "Pour tout objet x, si x ∈ E alors P(x)", et d'interpréter ∃x ∈ E, P(x) comme "il existe x tel que (x ∈ EetP(x)" sauf que ce ne sont pas des formules "autorisées" en théorie des ensembles puisqu'elles invoquent les quantificateurs sans domaines, et que P(x) risque de n'avoir aucun sens si x ∉ E.
Inversement, la notion d'appartenance peut se redéfinir (de façon parfaitement correcte) au moyen du quantificateur existentiel et de la notion d'égalité : x ∈ E ⇔ (∃y ∈ E, y=x).
Notons le cas particulier de l'ensemble vide: un énoncé de la forme (∃x ∈ ∅, …) est toujours faux, et un énoncé de la forme (∀x ∈ ∅, …) est toujours vrai. On a (∃ ∈ E,vrai) ⇔ E ≠ ∅, et donc aussi (∀x ∈ E, faux) ⇔ E=∅.
Inclusion
Etant donné un ensemble E, on dit qu'un ensemble F est inclus dans E (ou qu'il est une partie ou un sous-ensemble de E, ou encore qu'il est plus petit que E), et on écrit F ⊂ E, ssi tout élément de F appartient à E:
F ⊂ E ⇔ (∀x ∈ F, x ∈ E).
L'ensemble vide est inclus dans tout ensemble (y compris lui-même).
Si E ⊂ F, pour tout énoncé P défini sur F (et donc aussi sur E), si ∀x ∈ F, P(x) alors ∀x ∈ E, P(x); si ∃x ∈ E, P(x) alors ∃x ∈ F, P(x).
Egalité entre ensembles Axiome d'extensionnalité. Pour tous ensembles E et F, E=F ⇔ (E ⊂ FetF ⊂ E).
En effet, E ⊂ FetF ⊂ E signifie que E et F ont les mêmes éléments (pour tout x on a x ∈ E ⇔ x ∈ F); de plus, d'après la remarque ci-dessus, de E ⊂ FetF ⊂ E il résulte que pour tout énoncé P sur F on a toujours (∀x ∈ F, P(x)) ⇔ (∀x ∈ E, P(x)), et de même pour ∃. Ceci caractérise bien ce qu'on attend de la notion d'égalité entre E et F.
De là on vérifie qu'il ne peut y avoir qu'un ensemble vide.
On dira que F est strictement inclus dans E et on note F⊊E ssi F ⊂ E et F ≠ E, autrement dit
F ⊂ E et E⊄F.
Remarque à oublier
La description ci-dessus est conforme au concept d'ensemble tel
qu'il est quasi-universellement accepté en mathématique, et constitue un point de départ pour développer les
mathématiques de manière claire et naturelle,
suivant une logique formalisable sans hésitation. On pourrait pourtant faire des mathématiques autrement.
Ainsi, certains mathématiciens développent une autre logique, la "logique intuitionniste",
où la réunion de {0} et de ]0,1] serait incluse dans, mais non égale à [0,1]. (Hélas, je n'ai pas trouvé d'explication qui me satisfasse sur la signification de la logique intuitionniste ou ses rapports avec le reste des mathématiques, de sorte qu'en attendant je ne vois pas d'intérêt à faire davantage référence, dans les questions de fondements des mathématiques, à cette "logique" formelle qui me semble totalement arbitraire, parmi tant d'autres possibilités imaginables de changer les règles).
D'autre part (réflexion de mon cru cette fois-ci), certaines propriétés
de la théorie de la mesure (qui inclut la
théorie des probabilités) pourraient être interprétées sous forme d'énoncés plus
simples mais portant sur un tout autre concept d'ensembles, qu'on pourrait présenter ainsi:
Tirons une variable aléatoire x dans [0,1]. Pour cela, on peut par exemple
dire qu'on tire successivement à pile ou face chacune de ses décimales
binaires, ce qui fait un nombre infini de tirages au sort. Imaginons
un instant qu'on puisse définir le domaine E de x, qui soit ainsi
l'ensemble des nombres aléatoires dans [0,1], autrement dit ceux qu'on peut
obtenir par tirage aléatoire. Cet ensemble est non vide puisqu'on peut
effectuer des tirages aléatoires, obtenant des nombres réels qui existent.
Alors, l'évènement qu'un
autre nombre y ∈ E, tiré aléatoirement indépendamment de x soit égal à
x, a la probabilité zéro de se produire, et doit donc être considéré comme
une impossibilité. Ceci contredit l'affirmation plus haut qu'une variable y
décrivant indépendamment le même ensemble E que x,
pouvait prendre la même valeur que x.
Mais dorénavant banissons ces idées bizarres et tenons pour aquises les
notions classiques de domaine et d'ensemble telles qu'esquissées plus haut.
1.5. Applications, relations unaires et compréhension
Notion d'application
On appellera application un objet mathématique f constitué des données suivantes:
- Un ensemble appelé domaine ou ensemble de définition de f et noté Domf.
- Pour chaque élément x de Domf, la donnée d'un objet noté f(x), appelé image
de x par f.
De façon équivalente, on peut décrire une application f comme étant un symbole attaché à un symbole de variable, disons "x", de domaine Domf, tel que lorsqu'on fixe x (i.e. on lui fixe une valeur dans Domf), ce symbole f joue alors le rôle d'un symbole de constante.
Il y a une petite subtilité dans les notations du fait que dans l'utilisation d'une application,
on ne se contentera pas de faire varier sa variable x sur son domaine mais on se permettra aussi de lui donner une valeur précise au moyen d'un terme, afin qu'il en résulte une valeur précise de f(x). Par exemple, si on donne à x la valeur de y, le résultat sera f(y). Pour cela, le rôle du symbole de variable x dont dépend f est en fait joué typographiquement, non par une lettre mais par le lieu intérieur à la parenthèse, dans lequel on pourra écrire le terme que l'on veut à condition que sa valeur appartienne au domaine de f, pour utiliser cette valeur comme valeur de x.
Axiome d'extensionnalité des applications. Pour toutes applications f et g, on a
f=g ⇔ (
Dom
f=
Dom
get ∀x ∈
Dom
f,f(x)=g(x)).
En particulier, il existe une unique application de domaine ∅, appelée l'application vide.
Soit une application f et soit E=Domf. L'ensemble des valeurs
de f(x) pour tous les x ∈ E s'appelle l'ensemble image de
f et se note Imf. C'est le domaine de f(x) vu comme objet
variable du point de vue où x est variable de domaine E. Pour tout objet y on a y ∈ Imf ⇔ ∃x ∈ E, y=f(x).
On dira qu'un ensemble F est un ensemble d'arrivée de f ssi ∀x ∈ Domf, f(x) ∈ F.
Cette condition est équivalente à : Imf ⊂ F.
Etant donnés une application f et deux ensembles E et F, on dira que f est une application de E dans F pour signifier que (Domf=E) et (F est un ensemble d'arrivée de f).
On définit une application f de E dans F par les notations suivantes:
f:E
→ F
x
⟼ terme
où le "terme" est l'expression d'un objet dépendant de la variable x de domaine E, auquel f(x) devra être égal pour tout x ∈ E.
Nous désignerons aussi l'application définie par le terme de variable x en précisant son domaine E, mais sans préciser un ensemble d'arrivée, par la notation (E ∋ x ⟼ terme).
Une application f est dite constante ssi elle admet un singleton comme ensemble d'arrivée, autrement dit il existe un y (dans un ensemble d'arrivée de f donné), tel que ∀x ∈ Domf, f(x)=y. Pour le dire encore autrement, l'image de f est vide ou un singleton.
Dans le langage courant, une application peut prendre la forme d'un nom suivi d'un complément de nom, ce complément servant de variable. Exemple: "le père de (Untel)". Un tel nom qui d'abord sert à désigner une application de cette manière par l'ajout d'un complément, peut aussi souvent être employé sans complément, et interprété alors comme signifiant l'ensemble image de cette application.
Relations unaires, retour sur les quantificateurs
Notons l'ensemble des valeurs de vérité V
= {vrai, faux}.
On appelle relation unaire sur un ensemble E, une application de E dans V.
Tout comme on peut définir une application au moyen d'un terme, on peut définir une
relation unaire au moyen d'un énoncé, qui n'est en fait rien d'autre qu'un terme à valeurs dans V.
Implicitement, c'est ce que nous avions fait dans le contexte des notions de quantificateurs: quand nous disions qu'ils portaient sur un énoncé, en réalité nous voulions dire qu'ils portaient sur la relation unaire ainsi définie par cet énoncé. Prenant maintenant acte de ce fait, profitons-en pour reformuler les quantificateurs dans ce langage.
Soit donc R une relation unaire, et sous-entendons son domaine, fixe. Alors le quantificateur existentiel ∃x, R(x) se réécrit (vrai ∈ ImR), et également R ≠ (x ⟼ faux). Le quantificateur universel ∀x, R(x) se réécrit (faux ∉ ImR), et également R=(x ⟼ vrai).
Définition d'une partie par compréhension
Une relation unaire R sur E divise l'ensemble E en deux parties:
l'ensemble A des valeurs de x telles que R(x) vaut vrai, noté {x ∈ E|R(x)},
et celui des valeurs pour lesquels il vaut faux.
Autrement dit, l'idée de la construction de A est celle-ci: on prend la variable x de domaine E, puis, à l'intérieur du point de vue où x est fixe (une variable libre), on introduit R(x) comme axiome (on le suppose vrai). Alors, vu de l'extérieur, on a ce nouveau domaine A ⊂ E pour x, constitué des éléments de E sur lesquels R(x) est vrai.
Formellement, l'égalité A={x ∈ E|R(x)} se reconnaît au fait que A ⊂ E et ∀y ∈ E, y ∈ A ⇔ R(y).
L'ensemble vide s'obtient ainsi à partir de n'importe quel ensemble E par ∅
={x ∈ E|faux}.
Cette notion de compréhension qui transforme les relations unaires sur E en parties de E, est précisément l'inverse de celle d'appartenance, qui transformait les parties F de E (ou généralement les ensembles F) en relation unaire x ⟼ (x ∈ F) (applicable à tout objet de l'univers en général et donc tout élément de E en particulier). Ainsi, relations unaires sur E et parties de E sont la traduction l'un de l'autre; toute partie F ⊂ E peut être reconstruite par compréhension à partir de E et de la notion d'appartenance à F: F={x ∈ E|x ∈ F}.
Par cette traduction des relations unaires R sur E en parties F de E, les énoncés à quantificateurs se reformulent :
(∃x ∈ E, R(x)) ⇔ F ≠ ∅
(∀x ∈ E, R(x)) ⇔ F = E.
Il y a cependant une différence de fond, à savoir que la relation unaire ne comporte pas seulement la donnée de l'ensemble F mais aussi celle de son domaine E.