Union Européenne dans les livres – 1900 à 2000

Comme vous le savez peut-être, Je suis un peu fan de google labs et des outils de recherches qu’il propose. J’ai récemment joué avec Google Ngram Viewer. Cet outil recherche des mots et combinaisons de mots dans un corpus e texte, et représente le nombre d’occurrences du mot recherché (par rapport au volume du corpus) pour chaque année. C’est un outil utile dans les études litéraire pour découvrir quand un mot a fait son entrée dans le vocabulaire, ou disparu. J’ai décidé de regardé comment l’idée de l’Union Européenne avait fait son chemin dans les livres durant les derniers 100 ans.

La montée de l’Union Européenne

D’abord, je me suis concentré sur le terme “Union Européenne” (et ses traductions dans les autres langagues), en Francais, Anglais, Espagnol et Allemand (les quatre langues Européennes disponibles). Les résultats suivent, notez que l’échelle verticale n’est pas la même pour chaque graph, mais est normalisée au maximum.

Proportion du terme “Union Européenne” dans les corpus de texte des différents langages.

Nous pouvons remarqué que la distribution pour le corpus en Anglais (j’ai choisi le corpus général et pas celui spécifiquement Britannique ou Américain) est fort différent des autres distributions. Le Francais démarre tôt dans les années 50; de façon générale, le terme prend de l’importance au début des années 90.

A titre de comparaison, J’ai aussi regardé les résultats équivalent dans les trois autre langages disponibles  : Hébreu, Russe et Chinois.

Distribution pour les trois langues Hébreu, Chinois et Russe.

Dans ces distributions, le terme recherché démarre au milieu des années 90. Nous voyons que la tendance générale est la même dans toutes les langues étudiées. A l’exception de l’anglais, ce qui indique probablement un effet liés au contenu du corpus de texte.

Evolution de l’Union

Bien sur, l’apparition du terme Union Européenne dans les années 90 n’est pas une surprise, puisque jusqu’alors l’UE était en fait la Communauté économique Européeen, et avant cela, la Communauté Européenne du Charbon et de l’Acier. J’ai donc vérifié cela en vérifiant les distribution pour les acronymes des institutions.

Acronymes pour l’UE, la CEE et la CECA dans les textes Francais.
Acronymes pour l’UE, la CEE et la CECA dans les textes Anglais.

Le corpus en Anglais ne conduit à aucun résultat visible pour la ligne de la CECA (ECSC). Ce qui n’est pas surprenant puisque le Royaume Unis n’en faisait pas partit.

Cette rapide recherche montre qu’il y a un certain potentiel dans l’analyse avec Ngram pour observer l’évolution des idées Européennes avec le temps, notamment dans les premières années de l’Union. Cependant, le contenu du corpus utilisé pour la recherche peut influencer les résultats.

Advertisements


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s